Après Amazon, Google et Apple c'est au tour de Microsoft de devoir s'expliquer sur la manière dont il gère les données audio collectées auprès d'utilisateurs de Skype et de Cortana.
Des éléments (extraits audio, documents, captures d'écran) réunis par Motherboard, appuyés par le témoignage de l'employé d'un prestataire de Microsoft, montrent que le service de traduction automatique de Skype a lui-aussi besoin d'oreilles humaines pour s'améliorer.
Microsoft confie à des tiers l'écoute de fragments audio de quelques secondes et les traductions générées par le système de Skype. Il s'agit de vérifier celle qui est la plus pertinente et corriger le cas échéant, afin d'améliorer l'intelligence artificielle du logiciel.
Ces écoutes ne sont effectuées que dans le cadre de la fonction de traduction, pas pour des échanges Skype classiques puisqu'il n'y a pas lieu d'améliorer le contenu (la fonction a été lancée en 2014 sur Windows, lire Skype Translator : la traduction en temps réel pour Windows 8.1).
Premier problème, Microsoft indique sur la page de sa politique de confidentialité pour Skype Translator que des échantillons peuvent être analysés, mais sans dire clairement qu'il peut y avoir une intervention humaine : « Pour aider à la traduction et la technologie de reconnaissance vocale plus, des phrases et des transcriptions automatiques sont analysées et les corrections sont entrées dans notre système ».
Ensuite cette méthode a le même défaut qu'ailleurs : quand bien même ces éléments audio sont détachés de tout identifiant permettant de les relier à leur émetteur, les propos écoutés, parfois intimes, peuvent tout à fait contenir des noms ou des adresses. Ce que confirme l'employé interrogé par Motherboard.
Et puis comme chez ses concurrents, Microsoft s'appuie sur des employés de prestataires extérieurs, certains travaillant de chez eux. Ces géants du Net délèguent ces tâches répétitives plutôt que de se reposer sur des équipes internes. Microsoft se défend en assurant que les communications avec ces employés se font au travers d'un portail sécurisé.
Toujours dans sa réponse à Motherboard, l'éditeur confirme bien sûr que des fragments audio de Skype Translator sont étudiés, mais il estime que l'explication, relative à la manière dont sont traitées ces données, est de nature à informer les utilisateurs en toute transparence. Et que ces derniers doivent d'ailleurs donner leur autorisation préalable.
À aucun moment Microsoft ne consent à admettre que des intervenants humains, extérieurs à ses équipes qui plus est, sont dans la boucle.
Source : Motherboard