Meta a publié une implémentation « ouverte » de la fonctionnalité de génération de podcast viral dans le NotebookLM de Google.
Nomme NotebookLlama, le projet utilise les modèles Llama de Meta pour une grande partie du traitement, sans surprise. Comme NotebookLM, il peut générer des résumés en style podcast de va-et-vient de fichiers texte qui lui sont soumis.
NotebookLlama crée d’abord une transcription à partir d’un fichier – par exemple un PDF d’un article de presse ou d’un blog. Ensuite, il ajoute « plus de dramatisation » et des interruptions avant de soumettre la transcription à des modèles de synthèse vocale ouverts.
Les résultats ne sont pas aussi bons que ceux de NotebookLM. Dans les échantillons de NotebookLlama que j’ai écoutés, les voix ont une qualité clairement robotique et ont tendance à se couper mutuellement à des moments étranges.
Cependant, les chercheurs de Meta derrière le projet affirment que la qualité pourrait être améliorée avec des modèles plus performants.
NotebookLlama n’est pas la première tentative de reproduire la fonctionnalité podcast de NotebookLM. Certains projets ont connu plus de succès que d’autres. Mais aucun – même pas NotebookLM lui-même – n’a réussi à résoudre le problème d’hallucination qui affecte tous les IA. En d’autres termes, les podcasts générés par IA sont susceptibles de contenir des éléments inventés.
Il est important de noter que NotebookLlama est une initiative intéressante qui ouvre de nouvelles perspectives dans le domaine de la génération de contenu audio. Les pistes d’amélioration évoquées par les chercheurs laissent entrevoir un potentiel de développement prometteur pour cette technologie.
Pour en savoir plus sur NotebookLlama et ses fonctionnalités, vous pouvez consulter le lien vers le projet sur GitHub. N’hésitez pas à explorer les possibilités offertes par cette nouvelle implémentation de la génération de podcast et à suivre de près les évolutions futures de cette technologie fascinante.