Ouvrir le menu principal

iGeneration

Recherche

Apple dément avoir entrainé Apple Intelligence sur des sous-titres de vidéos YouTube

Félix Cattafesta

Thursday 18 July 2024 à 10:30 • 42

iOS

En début de semaine, une enquête révélait comment certaines grandes boites de la tech - dont Apple - utilisaient une base de données basées sur des transcriptions de vidéos YouTube pour former leurs modèles d’intelligence artificielle. Cette source de près de 900 Go a été créée sans le consentement des vidéastes, ce qui n’a pas manqué de faire polémique. Apple a aujourd’hui clarifié les choses auprès de 9to5Mac : si elle a bien utilisé cet ensemble de données pour mettre sur pied son modèle open source OpenELM, le moteur ne sert pas à faire carburer les fonctions d’IA de son écosystème.

La base de données en question contient des textes tirés de plus de 48 000 chaînes pour un total de 173 536 vidéos. Parmi eux, de grands noms comme PewDiePie, MrBeast ou différentes émissions comme les Late Show de Stephen Colbert, John Oliver ou Jimmy Kimmel. L’affaire avait fait du bruit étant donné que les vidéastes n’étaient pas au courant de la réutilisation de leur travail. Certains youtubeurs comme MKBHD ont réagi dans la foulée via une vidéo.

Le modèle entrainé par Apple à l’aide de cette source est OpenELM, un modèle open source disponible sur GitHub pensé pour ne pas prendre trop de place et tourner localement. La page Github explique que les différents modèles OpenELM ont été « entraînés sur des ensembles de données publics » et que leur publication « vise à renforcer et à enrichir la communauté de la recherche ». Dans sa déclaration faite à 9to5, Apple affirme qu’elle n’utilise pas ce moteur pour ses fonctions d’IA ou pour le futur Apple Intelligence. Elle précise qu’elle n’a pas prévu d’en créer une seconde version.

Apple n’est pas la seule à s’être appuyée sur cette base de données : Google utiliserait les vidéos de YouTube pour ses IA, tandis qu’OpenAI aurait également moissonné la plateforme pour créer son modèle Sora. Depuis quasiment un an, Apple publie régulièrement des modèles de langage open source : on a par exemple vu arriver Ferret ou Matryoshka Diffusion pour ce qui est de la génération d’images.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Si elle veut remplacer HomeKit par Matter, Apple ne montre pas le bon exemple

15:00

• 23


Test de l'Insta360 Flow Pro, le stabilisateur compatible DockKit qui simplifie le suivi

10:00

• 4


iPhone 16 Pro : un rendu possible du nouveau coloris

09:02

• 32


Sonos publie le tableau complet des corrections à venir

30/08/2024 à 22:15

• 24


Un contentieux entre Apple et Spotify sur les boutons de volume de l'iPhone

30/08/2024 à 20:45

• 60


La production de l’iPhone 16 Pro aurait démarré en Inde

30/08/2024 à 20:31

• 5


Apple Intelligence occupe autour de 2,5 Go dans iOS 18.1 et 5,5 Go dans macOS 15.1

30/08/2024 à 18:00

• 36


PayPal pourrait vite venir concurrencer Apple Pay en Europe

30/08/2024 à 17:00

• 55


Apple prévoirait d’investir dans OpenAI

30/08/2024 à 16:38


Gomme magique : que vaut l’outil d’effacement d’Apple face à celui de Google ?

30/08/2024 à 15:00

• 35


La version Director's Cut de Napoléon est sur Apple TV+… mais pas en France

30/08/2024 à 12:00

• 54


Apple Sports va (enfin !) afficher des activités en direct avec iOS 18, mais toujours pas en France

30/08/2024 à 09:00

• 22


Pour un Sac Eastpak, acheté recevez un bon d’achat de 15 €

Partenaire


Sans Apple Pay, l’iPhone va-t-il perdre en simplicité pour les paiements ?

29/08/2024 à 20:30

• 120


Guide d’achat : les meilleurs accessoires Apple Watch et tech pour le sport

29/08/2024 à 18:05


Découvrez Youseeme : le compte unique qui réunit euros et cryptos ! 📍

29/08/2024 à 15:32