Ouvrir le menu principal

iGeneration

Recherche

Des oreilles humaines pour améliorer la cervelle d’Alexa

Mickaël Bazoge

jeudi 11 avril 2019 à 18:24 • 32

Ailleurs

L’intelligence artificielle a besoin d’un peu d’huile de coude humaine pour lubrifier ses neurones. Amazon emploie des milliers de personnes dans le monde pour littéralement écouter aux portes des utilisateurs d’Alexa, raconte aujourd’hui Bloomberg.

Ces équipes sont chargées de transcrire et annoter les enregistrements audio des possesseurs d’enceintes Echo et consorts. Il s’agit d’abord de s’assurer qu’Alexa a bien compris les requêtes et a apporté une réponse satisfaisante. Ce travail de scribe permet aussi de nourrir la petite cervelle de l’assistant, d’améliorer sa compréhension du discours humain et in fine, de l’aider à mieux répondre aux ordres.

Le boulot est confié à des employés d’Amazon et à des intérimaires, qui travaillent à Boston, au Costa Rica, en Inde ou encore en Roumanie. Pendant neuf heures par jour, ces salariés écoutent jusqu’à mille clips audio. Dans un exemple donné par la publication, un employé a relevé les occurrences de « Taylor Swift » dans les ordres vocaux des utilisateurs d’Alexa.

Il arrive aussi à ces forçats de tomber sur des enregistrements qui sortent de l’ordinaire, comme une chanson massacrée par une utilisatrice sous sa douche, ou encore les pleurs d’un enfant. Les équipes partagent parfois des extraits sur leur messagerie interne… Dans les cas plus sérieux comme des enregistrements d’agression sexuelle, les employés doivent se débrouiller avec leur conscience bien qu’Amazon assure que des procédures sont en place.

Cette histoire rappelle celle des grandes oreilles de Ring qui, elles aussi, ont accès aux enregistrements vidéo des sonnettes connectées acquises par Amazon (lire : Les employés de Ring ont pu espionner les sonnettes et caméras de leurs utilisateurs). Le géant du commerce en ligne se défend de tout espionnage, et explique que ces annotations ne concernent qu’un tout petit échantillon des enregistrements audio d’Alexa.

Ces opérations sont effectuées pour « améliorer l’expérience des consommateurs », assure Amazon. « Par exemple, ces informations nous aident à entraîner nos systèmes de reconnaissance vocale et de compréhension du langage. Alexa peut ainsi mieux comprendre les requêtes, et s’assurer que le service fonctionne bien pour tout le monde ». L’entreprise ressert le couplet des garde-fous et de sa tolérance zéro pour les abus, et assure de son engagement pour la sécurité et la confidentialité de ses clients.

Les employés n’ont pas accès aux informations qui permettraient d’identifier les utilisateurs, et « toutes les données sont traitées avec un haut degré de confidentialité ». Malgré tout, Bloomberg a obtenu une capture d’écran sur laquelle figurait un numéro de compte, le prénom de l’utilisateur ainsi que le numéro de série de l’appareil.

Il existe une option dans les réglages d’Alexa qui désactive la possibilité d’utiliser des messages pour améliorer les transcriptions, mais Amazon reconnait que des enregistrements provenant de ces utilisateurs peuvent toujours être analysés par ses équipes.

Désactiver cette option ne sert pas à grand chose de l’aveu même d’Amazon.

Les enregistrements transcrits par les petites oreilles humaines d’Amazon sont les requêtes des utilisateurs lancés après avoir dit le mot magique « Alexa » (ou un autre déclencheur). Alexa peut toutefois s’activer sans y être invitée, par exemple via un mot entendu de travers. Les employés d’Amazon, qui sont tenus de retranscrire tous les bouts d’enregistrement, peuvent tomber chacun sur une centaine de ces extraits non désirés par jour.

Les algorithmes ont besoin de mieux connaitre les spécificités des langages, ce qui permet par exemple à l’assistant d’Amazon de distinguer les mots « avec ça » du déclencheur « Alexa » (lire : Apprendre le français à Alexa n'a pas été chose facile pour Amazon).

Apple fait d’ailleurs de même pour Siri : des humains écoutent des extraits audio impossibles à identifier, qui sont stockés pendant six mois avec un identifiant aléatoire. Ensuite, l’enregistrement peut être conservé pendant deux ans, mais sans aucun identifiant, selon le livre blanc sur la sécurité édité par Apple.

Google pratique de la même manière pour son Assistant, mais les extraits audio ne sont pas associés avec un identifiant.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Promo : les AirPods Pro 2 à 220 € (-59 €)

20/04/2025 à 19:05

• 15


À la découverte de l’écosystème UniFi, l’équipement réseau des pros accessible au grand public

20/04/2025 à 19:04

• 63


Les ventes d’iPhone chutent drastiquement en Chine

20/04/2025 à 19:00

• 28


Un humanoïde boucle le semi-marathon de Pékin en 2h40

20/04/2025 à 12:17

• 16


Promo : déjà 10 % de remise sur l’iPad Pro M4 et l'iPad Air M3 (à partir de 649,99 €) 🆕

20/04/2025 à 08:08

• 11


Promo : les prix des MacBook Air M4 et MacBook Pro M4 continuent de baisser - jusqu'à 10 % de remise ! 🆕

19/04/2025 à 16:02

• 10


Avant un iOS 19 très attendu, retour sur l'interface des 18 versions d'iOS

19/04/2025 à 10:00

• 48


Sosh frappe fort : 200 Go de 4G pour 10 €, les rivaux contre-attaquent 🆕

19/04/2025 à 09:40

• 43


Sortie de veille : le futur de l’iPad se trouve-t-il dans le Mac ?

19/04/2025 à 09:23

• 20


Spotify augmente ses tarifs au Benelux : bientôt en France ?

18/04/2025 à 20:15

• 36


La Switch 2 sera en précommande aux États-Unis et Canada le 24 avril

18/04/2025 à 16:52

• 21


Netflix teste un moteur de recherche avec OpenAI et un nouvel écran d'accueil

18/04/2025 à 16:05

• 10


Après les smartphones, voici une liseuse pliante avec un écran E Ink en couleur

18/04/2025 à 15:36

• 15


AltStore PAL simplifie l’installation d’apps non notarisées et l’activation de JIT

18/04/2025 à 10:25

• 9


Les dernières publicités de Beats vantent avec humour les mérites des nouveaux câbles colorés de la marque

18/04/2025 à 08:03

• 26


Netflix augmente ses prix en France sur fond de bons résultats

18/04/2025 à 07:25

• 199