Gemini a transformé mes recherches complexes en podcast : Je ne souffrirai plus jamais

Transition de Google Assistant à Era GEMINI, presque dans sa phase finale. On peut se sentir nostalgique de l’assistant virtuel du même nom, mais il est indéniable que l’arrivée de Gemini a véritablement changé ce qu’un agent IA peut faire pour nous.

Les compétences de compréhension du langage sont bien meilleures avec les Gémeaux. Les conversations sont naturelles, les interactions avec les applications sont fluides et l'intégration avec d'autres produits Google est enrichissante. Même dans son état libreGemini surpasse Siri même sur iPhone.

Cependant, il existe quelques astuces qui placent les Gémeaux dans une catégorie complètement différente. Recherche approfondie C'est l'une de ces fonctionnalités proxy que j'utilise quotidiennement et qui continue de m'étonner. En mars, Google a ajouté une autre fonctionnalité intéressante à l'arsenal de Gemini : les aperçus audio.

Transformez tout en podcast

Invite de présentation audio dans Gemini.

Imaginez transformer vos documents ennuyeux, votre document de recherche trop complexe ou votre matériel de lecture académique en une conversation de podcast animée en tête-à-tête. C’est l’essence même de la fonctionnalité « Audio Briefs ». La fonctionnalité est apparue pour la première fois sur le très décrié NotebookLM de Google, et a finalement été portée sur l'expérience principale de Gemini sur mobile et Web.

Vous n’avez pas besoin de passer par des procédures techniques ou d’écrire une invite de script très spécifique pour obtenir ces ajustements audio. Téléchargez simplement un fichier à partir du sélecteur de pièces jointes et la diapositive Créer un flux vocal apparaîtra juste au-dessus de la zone de discussion. Cliquez dessus et le podcast commencera à se créer.

Cela peut prendre quelques minutes, mais en attendant, vous pouvez passer en toute sécurité à une autre application (ou fenêtre). Une fois le processus terminé, vous recevrez une notification indiquant que le podcast est prêt à être écouté ou partagé avec d'autres.

La critique audio est généralement une conversation à double sens, fluide et avec un ton étrangement naturel. On a l'impression de parler à Gemini Live, ce qui semble beaucoup plus naturel que n'importe quel chatbot intelligent que j'ai utilisé jusqu'à présent en mode conversation vocale.

Je dirais que ces podcasts générés par l’IA sont très bien faits. Mais je suis attiré par cela pour plusieurs raisons. Tout d’abord, je passe la majeure partie de ma journée à regarder un écran, à lire des articles pour mes recherches et à écrire mes propres articles.

Création du podcast Gemini en cours.

Cela laisse peu de place à l’interaction avec tout autre matériel textuel, qu’il soit académique, commercial ou même de divertissement. Cependant, si vous pouvez simplement changer le mode sensoriel d’interaction avec ces matériaux, la fatigue de lecture s’atténuera.

Les podcasts audio offrent une toute nouvelle façon d’interagir avec le contenu textuel de manière plus immersive. Cela nous amène à la deuxième caractéristique, qui est la stimulation sensorielle, ou contraste. Cette formule a été bien documentée et testée dans le domaine de la formation académique et professionnelle.

Comment cela m'a-t-il aidé ?

La fatigue liée à la lecture affecte votre capacité de concentration. Cela donne l'impression que même un travail passionnant est votre travail, simplement parce que vous ne pouvez pas vous permettre de le manquer. Cependant, interagir avec la même œuvre, ou son essence, à travers un support sensoriel différent réduit cette peur de la surcharge textuelle. En fait, cela aide de plusieurs autres manières.

« L’engagement de plusieurs sens renforce la mémoire », explique Yasser Naseem, un expert en linguistique dont les recherches se sont concentrées sur la modernisation et le développement des méthodes d’enseignement. « Lorsque nous écoutons et participons, que ce soit par la lecture, l’écriture ou l’action, le cerveau établit des connexions plus fortes, ce qui facilite la mémorisation ultérieure. »

Naseem, qui travaille actuellement comme expert en programmes scolaires dans une importante société d'éducation en ligne, me dit que vous ne pouvez pas compter sur une seule méthode d'apprentissage. Au lieu de cela, me dit-il, vous devez combiner différentes méthodes pour obtenir un bénéfice maximal, de l’impact émotionnel à la rétention de la mémoire.

Gemini crée un aperçu audio.

Les recherches publiées dans la revue mettent en évidence Informatique et éducation De plus, les étudiants ont découvert que les fichiers audio étaient le meilleur matériel d’apprentissage et de révision. La flexibilité et la variété sensorielle ont joué un rôle majeur dans leur préférence pour les podcasts par rapport aux autres médias.

« La véritable compréhension et la rétention à long terme se produisent lorsque l’écoute est associée à des éléments visuels, des discussions ou des activités pratiques », ajoute Naseem. Mes propres expériences avec les résumés audio de Gemini concordent avec ses conseils. J’ai une meilleure mémoire des connaissances que j’ai absorbées grâce aux podcasts audio que lorsque j’ai lu le même matériel..

Vous voyez, ces podcasts audio ne sont pas une simple conversion texte-audio. Au lieu de cela, il déconstruit un mur de texte ennuyeux en une conversation entre deux personnes, avec vous comme seul public. C'est une aubaine pour tout matériel textuel qui ne pique pas immédiatement votre intérêt et ne vous encourage pas à continuer à lire.

Dans ma récente expérience, le podcast audio Gemini m'a aidé à comprendre l'importance d'un article de recherche traitant d'un « cadre pour l'apprentissage neuronal interprétable basé sur des fonctions objectives basées sur des informations locales ». En termes plus simples, l’étude a examiné la manière dont les neurones s’organisent.

Vous comprenez ce que j'essaie de dire ici, n'est-ce pas ?

Le confort avant tout

Gemini AI crée un podcast audio à partir d'un article de recherche.

Le confort joue un rôle important lorsqu’il s’agit d’absorber des informations. Ainsi que l’enthousiasme et l’excitation suscités par l’ensemble du processus. Selon une étude publiée dans la revue Ordinateurs en comportement humainLes podcasts « favorisent la commodité, la flexibilité et l’accessibilité à l’information et aux connaissances ». Il ne m’a pas fallu longtemps pour m’en rendre compte.

Habitant dans la capitale nationale, passer 2 à 3 heures coincé dans les embouteillages ou dans les transports en commun est une réalité quotidienne pour moi. Mais plus que l’inconfort, c’est le temps perdu qui fait le plus mal. Les supports d’apprentissage audio constituent le moyen le plus pratique d’utiliser ce temps de manière productive.

Avec Gemini, vous bénéficiez d’un autre avantage crucial. Il n’est pas nécessaire de compter sur la disponibilité audio pour un livre, un article de presse ou un document académique particulier. Vous pouvez simplement télécharger n'importe quel matériel à votre disposition et Gemini le transformera en une conversation podcast.

Il existe de nombreuses recherches multidisciplinaires qui soutiennent les avantages d’une approche d’apprentissage basée sur l’audio. Il ne s’agit pas seulement d’écouter, il s’agit bien plus de décomposer les choses et de les présenter de manière plus accessible.

« Certaines personnes ont dit… qu’elles apprécient le fait que nous leur donnions des informations qu’elles ne lisent pas dans le journal », ont déclaré les chercheurs citant un rédacteur en chef. « Ils aiment le fait que… nous essayons de nous présenter d’une manière différente. » L’article de recherche, publié par l’Université de Syracuse, a été publié en 2006, au tout début de la tendance du podcasting.

Génération d'un podcast de présentation audio dans Gemini.

En 2025, les podcasts sont devenus un véritable phénomène de consommation d’informations, du matériel éducatif au divertissement. Selon Pew Research CenterPrès de la moitié des Américains ont participé à des podcasts. Plus de la moitié du public interrogé a écouté des podcasts pour apprendre, se divertir ou obtenir du son tout en faisant autre chose.

Près d'un tiers d'entre eux souhaitaient entendre l'opinion des autres, et un autre segment important était en ligne pour pouvoir suivre l'actualité et les événements en cours. Mon message n’était pas trop éloigné du modèle ci-dessus. Pour le journalisme de longue haleine ou le travail d'investigation, j'ai souvent trouvé leur version podcast plus satisfaisante.

Plus efficace aussi

Il est intéressant de noter que les podcasts semblent également être à l’origine de changements pratiques. Environ deux tiers des auditeurs ont lu un livre ou un film après avoir écouté un podcast, plus de la moitié du public a commencé à suivre quelqu'un sur les réseaux sociaux et un tiers a apporté des changements à son mode de vie, comme faire de l'exercice ou changer son régime alimentaire.

Points saillants des recherches publiées Magazine de marketing sur les réseaux sociaux Concepts tels que la substitution des médias et la similarité fonctionnelle dans le contexte de l’écoute des médias et de la préparation du public. L’idée principale est que les utilisateurs évaluent les médias et choisissent celui qui leur convient le mieux.

« En ce qui concerne la spécificité du contenu des podcasts, l’effet sur la volonté d’écouter et la substitution des médias est positif, ce qui suggère qu’un contenu unique, de haute qualité et une grande variété incitent les gens à écouter des podcasts », indique l’étude. Je confirme personnellement la validité de ce résultat également.

Au cours des derniers jours, j'ai « converti » plusieurs articles de recherche discutant de l'impact de la consommation de fibres, de viande et d'aliments emballés sur les habitudes de sommeil, la santé cognitive et la santé intestinale sous forme de podcast. Comparé au ton ouvertement technique des articles scientifiques, le fait que deux animateurs expliquent les résultats sur un ton « émotionnel » et « convaincant » a eu un impact sensiblement plus profond sur moi.

Considérez cela comme l’apprentissage de l’étiquette sociale ou des sensibilités culturelles à partir d’un livre. Des années plus tard, vous voyez réellement ces choses de vos propres yeux. Ou pensez à l’apprentissage d’une langue étrangère à partir d’un livre, par vous-même, et à la différence que cela fait lorsque vous l’apprenez de quelqu’un qui vous remplit les oreilles de toutes ces connaissances.

Cette dernière méthode donne de meilleurs résultats. Cela est principalement dû au fait que l’effet combiné de l’engagement multisensoriel accélère le processus d’apprentissage ou le rend plus efficace. Les aperçus audio de Gemini ont eu un effet similaire et m'ont beaucoup aidé.

Quelques obstacles

Aussi productive que cela puisse paraître, la fonction Aperçu vocal de Gemini n'est pas parfaite. L’essence d’une histoire magnifiquement écrite peut se perdre dans les tentatives de « podcasting », ou certains petits détails peuvent être manqués. Il y a aussi quelques bizarreries fonctionnelles. La longueur d’un aperçu audio, qui est directement proportionnelle à la profondeur du matériel source, peut être complètement arbitraire.

Par exemple, lorsque j’ai donné à Gemini un livre de 260 pages sur le thème de la conjugaison des verbes et de la morphologie en persan, l’aperçu audio généré par Gemini durait un peu plus de sept minutes. Qualitativement, il couvrait les parties les plus importantes, mais manquait les détails les plus fins.

Dans un autre cas, j’ai transformé un document de recherche approfondi de quatre pages en un podcast audio. Ce podcast a duré environ 13 minutes. Malheureusement, la puce Auto Tasks de Gemini ne vous permet pas d'ajuster la longueur ou la profondeur de la conversation dans l'aperçu vocal.

Si vous utilisez Google NotebookLM, où la fonctionnalité d'aperçu audio a fait ses débuts, vous pouvez écrire une invite qui peut déterminer la profondeur d'une conversation de podcast. J'ai créé un podcast audio d'une durée de 59 minutes sur NotebookLM il y a quelques semaines.

Les Gémeaux ne vous laisseront pas faire. pas encore.

Ensuite, il y a la barrière de la langue, car Google travaille actuellement à l’amélioration de l’ensemble du pipeline en dehors de l’anglais. Un autre problème était la prononciation empruntée à l’anglais. Par exemple, l’animateur du podcast IA a prononcé à tort le mot persan « Raf-thin » en « Raaf-tin ».

Pour l'oreille non avertie qui ne connaît pas les différences linguistiques bilingues entre la traduction anglaise et persane, ou la façon dont les accents affectent la perception auditive des mots dans une langue différente, les animateurs de podcasts IA peuvent débiter des absurdités complètes.

Mon expérience globale est que les « aperçus audio » de Gemini ne sont pas révolutionnaires. Cela offre simplement une manière différente et plus attrayante d’interagir avec le contenu. Cela ne fonctionne pas tout le temps, mais cela soulage certainement l'ennui de lire des pages de texte qui, autrement, vous endormiraient.

Les commentaires sont fermés.