Scribe est une application pour iOS utilisant les dernières technologies d’IA génératives pour transcrire rapidement des vidéos YouTube. Le fonctionnement est assez simple : vous entrez l’URL de la vidéo avant que le téléphone ne mouline pour vous générer une transcription avec une ponctuation adaptée, des titres et même une table des matières. Il est possible de cliquer n’importe où pour entendre le texte de la vidéo, synchronisé avec la version textuelle.
Cette application sera pratique pour survoler le contenu de longues vidéos sans ses écouteurs à portée de mains, ou encore pour jeter un bref coup d'œil à de grosses interviews. Les transcriptions sont enregistrées sur le téléphone, tout comme les vidéos qui peuvent être consultées simplement en passant son iPhone à l’horizontale. Le traitement se fait de manière rapide.
Le développeur précise que toute la transcription se fait localement sur l’appareil et que son app ne collecte aucune information personnelle. Un petit modèle d’IA est visiblement embarqué pour générer les titres et la ponctuation, ce qui justifie les quelque 750 Mo de l’application. Les transcriptions peuvent ensuite être exportées au format PDF pour être partagées.
Certaines améliorations restent à effectuer : la transcription se fait automatiquement en anglais, peu importe que votre vidéo soit en français ou dans une autre langue. Il y a donc une transcription doublée d’une traduction, sans option pour choisir précisément ce que l’on veut. L’interface de lecture des vidéos pourrait également être améliorée. Le résultat côté texte n'est pas parfait, mais reste exploitable.
L’app est encore jeune, et on peut espérer que le développeur trouvera moyen d’améliorer ces différents points. Scribe est pour le moment proposé gratuitement sur l’App Store, mais un unique achat in-app est dans les tuyaux afin de monétiser le projet. Le programme fonctionne également sur Mac M1 ou directement via un site web, le traitement étant effectué par le navigateur.