Ouvrir le menu principal

iGeneration

Recherche

Microsoft présente Phi-3, un petit modèle d’IA prometteur pouvant tourner en local sur un iPhone 14

Félix Cattafesta

mercredi 24 avril 2024 à 14:47 • 14

Ailleurs

La sortie de ChatGPT vous a peut-être rendu familier avec le concept de LLM, ces Large Language Model capables de générer du texte et de donner la réponse la plus probable à une requête. Mais il existe également des déclinaisons plus petites baptisées SLM (Small Language Model), que l’on connaît bien dans l’écosystème Apple étant donné que l’un d’entre eux carbure sous le clavier de Sonoma et d’iOS 17. Microsoft n’est pas en reste et a récemment levé le voile sur Phi-3-mini, un modèle similaire présenté comme « les plus performants et le plus rentable du marché ». Sa petite taille lui permet de tourner facilement en local sur un ordinateur, et même correctement sur un smartphone.

Le modèle tournant sur un iPhone 14. Image : Microsoft.

Phi-3-mini est un petit modèle à 3,8 milliards de paramètres, prochainement décliné en plusieurs variantes plus grosses. Malgré sa petite taille quand on le compare aux mastodontes du domaine, Microsoft assure que son produit propose des performances pouvant rivaliser avec la concurrence, citant entre autres GPT-3.5. Le chercheur spécialisé Simon Willison a pu jouer avec avant de partager son expérience à ArsTechnica. Il explique que le modèle peut tourner à une vitesse convenable sur un appareil avec 8 Go de RAM et un CPU standard. « Il devrait fonctionner correctement sur un Raspberry Pi à 55 $ et la qualité des résultats que j'ai pu observer jusqu'à présent est comparable à des modèles quatre fois plus grands », ajoute-t-il.

Dans leur papier de recherche, ses créateurs expliquent l’avoir fait tourner sur un iPhone 14 embarquant la puce A16 Bionic. Le modèle a réussi à générer 12 tokens par seconde, ce qui est plus qu’honorable.

Pour obtenir de telles performances, Microsoft a entrainé son IA sur des données de très haute qualité reprise de manuels scolaires et de contenus soigneusement sélectionnés. L’idée serait de pouvoir proposer une alternative aux grosses machines comme GPT-4, pouvant tourner localement et sans connexion dans le nuage. Une limitation du modèle vient de ses connaissances restreintes par rapport aux concurrents plus imposants, mais ce point n’est pas forcément primordial pour toutes les tâches confiées à un LLM. Phi-3 peut être téléchargé via le service de Cloud Azure, mais aussi depuis la plateforme HuggingFace et Ollama.

Exécuter un grand modèle de langage sur son iPhone, c’est déjà possible

Exécuter un grand modèle de langage sur son iPhone, c’est déjà possible

Ce n’est pas la seule sortie de Microsoft côté IA cette semaine. L’entreprise a également publié WizardLM2, un modèle open source présenté comme très puissant. Seul problème : il a été supprimé quelques heures après sa mise en ligne, Microsoft ayant visiblement oublié l’étape du « test de toxicité ». Difficile de savoir si celui-ci est complètement non censuré et potentiellement dangereux, mais on devrait le savoir assez vite étant donné que de multiples copies sont désormais dans la nature.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Sosh frappe fort : 200 Go de 4G pour 10 €, les rivaux contre-attaquent 🆕

09:40

• 23


Sortie de veille : le futur de l’iPad se trouve-t-il dans le Mac ?

09:23

• 2


Spotify augmente ses tarifs au Benelux : bientôt en France ?

18/04/2025 à 20:15

• 32


La Switch 2 sera en précommande aux États-Unis et Canada le 24 avril

18/04/2025 à 16:52

• 15


Netflix teste un moteur de recherche avec OpenAI et un nouvel écran d'accueil

18/04/2025 à 16:05

• 9


Après les smartphones, voici une liseuse pliante avec un écran E Ink en couleur

18/04/2025 à 15:36

• 12


AltStore PAL simplifie l’installation d’apps non notarisées et l’activation de JIT

18/04/2025 à 10:25

• 9


Les dernières publicités de Beats vantent avec humour les mérites des nouveaux câbles colorés de la marque

18/04/2025 à 08:03

• 25


Netflix augmente ses prix en France sur fond de bons résultats

18/04/2025 à 07:25

• 190


Discord teste la vérification de l’âge par IA ou par pièce d’identité au Royaume-Uni et en Australie

17/04/2025 à 21:45

• 7


Strava se paye Runna, l'app de course à pied spécialisée dans le coaching par IA

17/04/2025 à 17:04

• 11


Incogni lance un plan Unlimited (et c’est une petite révolution dans la protection des données) 📍

17/04/2025 à 16:28

• 0


Les caméras de Reolink certifiées pour leur bon fonctionnement avec Home Assistant

17/04/2025 à 15:30

• 8


B&You réduit le prix de son forfait avec 200 Go de 5G pour les abonnés B&You Pure fibre

17/04/2025 à 11:46

• 8


Les iPhone des Apple Store vont se recharger avec de l'énergie bas carbone

17/04/2025 à 10:30

• 6


Google Maps va désactiver les avis sur les établissements scolaires à la fin du mois

17/04/2025 à 09:51

• 34