Gemini Live est le nouveau mode vocal du chatbot de Google, dévoilé en amont de la présentation des nouveaux smartphones Pixel. Cette réponse au mode vocal de ChatGPT est très impressionnante : voici comment ça marche.
La conférence Made By Google est actuellement en cours et peut se regarder ici. La firme de Mountain View a ouvert les hostilités directement avec ses avancées en matière d’intelligence artificielle. Peu importe que l’IA fasse peur aux clients qui n’achètent pas les produits l’intégrant : c’est le cheval de bataille de Google, qui affirme être désormais dans “l’ère de Gemini“.
On a donc rapidement vu arriver sur scène la vice-présidente de Google en charge de ce domaine, Jenny Blackburn. Celle-ci est venu présenter les avancées de Gemini, sous sa forme de chatbot. Après un petit cafouillage durant la démo de l’intégration de Gemini dans les applications Tasks, Calendar et Keep, la cadre de Google a présenté une véritable nouveauté : Gemini Live.
C’est quoi Gemini Live, cette nouveauté de l’intelligence artificielle de Google
Live est le nouveau mode vocal du chatbot, “la manière la plus naturelle d’interagir avec Gemini” selon Google. Il permet une conversation avec le chatbot comme avec n’importe quelle personne. Il est ainsi possible de l’interrompre ou de changer de sujet au milieu de la conversation pour obtenir de meilleurs résultats.
Gemini Live sera doté de 6 voix à choisir selon vos préférences, dont 3 ont été présentées avec leurs caractéristiques :
- Vega : claire, plus aiguë
- Dipper : engagée, plus grave
- Ursa : engagé, tessiture moyenne
Pour montrer son fonctionnement, Jenny Blackburn lui a demandé :
Ma nièce et mon neveu viennent ce week-end, et j’ai besoin de quelques idées pour quelque chose d’amusant et d’éducatif que nous pourrions faire ensemble. Je pensais peut-être à une expérience de chimie, quelque chose d’un peu magique.
À lire > Gemini sera bientôt plus efficace sur Android grâce à de nouvelles extensions
Gemini lui a proposé alors de faire un volcan maison, une expérience de chimie plutôt classique avec “un sentiment d’excitation lorsqu’il entre en éruption“. Le chatbot lui demande alors si elle veut entendre d’autre propositions, ce à quoi la cadre de Google lui répond : “Absolument, pense vraiment magie“. L’IA lui propose alors de fabriquer lampe à lave avec de l’encre réactive à la chaleur.
Mme Blackburn lui demande alors si l’atelier ne sera pas trop salissant, Gemini lui répond qu’il faudra simplement couvrir le plan de travail. Enfin, la cadre de Google lui demande des suggestions de noms pour cette expérience : l’IA propose “L’Académie d’entraînement d’espions” ou “Le laboratoire des messages secrets“.
Pour une démo visuelle, Gemini Live est extrêmement dépouillé. Aucune image d’illustration n’est proposée en parallèle de la conversation : on a vraiment l’impression de discuter avec un contact au téléphone.
Difficile de ne pas voir un parallèle entre la bêta du mode vocal de ChatGPT et le déploiement de ce mode pour Gemini. La firme de Mountain View semble à chaque fois avoir une réponse prête à envoyer à OpenAI.