Imaginez avoir un assistant super intelligent intégré directement à votre navigateur web, prêt à vous aider à comprendre tout ce que vous voyez en ligne. C’est essentiellement ce que Google déploie avec sa nouvelle intégration de Gemini dans Chrome, mettant la puissance de son modèle d’IA directement à portée de main pendant que vous naviguez. Ce n’est pas juste une autre application web; cette IA peut réellement « voir » et comprendre le contenu de la page web que vous visitez, promettant un nouveau niveau d’assistance en ligne.
Contenu
Ce premier aperçu montre que Gemini dans Chrome est un grand pas vers la vision de Google de rendre l’IA plus proactive et utile, agissant presque comme un agent numérique. Bien que ce soit encore un travail en cours et actuellement uniquement disponible pour certains utilisateurs (abonnés AI Pro ou AI Ultra utilisant des versions bêta spécifiques de Chrome), son potentiel est clair.
Que peut faire Gemini dans Chrome dès maintenant ?
Démarrer est simple : un nouveau bouton Gemini apparaît dans le coin supérieur de Chrome. Cliquer dessus ouvre une fenêtre de chat où vous pouvez poser des questions sur la page sur laquelle vous vous trouvez.
L’une des utilisations les plus pratiques que j’ai trouvées est de résumer des articles. Au lieu de faire défiler de longs textes, vous pouvez demander à Gemini les points clés. Cela fonctionne pour les articles de presse, les articles de blog ou tout contenu écrit. Cependant, Gemini ne peut lire que ce qui est actuellement visible sur la page. S’il y a du contenu caché ou réduit (comme une section de commentaires), vous devez le développer avant de demander à Gemini de le résumer. Il vous suit également à travers les onglets, mais se concentre sur une seule page à la fois.
Gemini AI résumant les commentaires dans le navigateur Chrome
Au-delà du texte, Gemini est étonnamment utile avec les vidéos, notamment sur des plateformes comme YouTube. Vous pouvez lire une vidéo et poser des questions à Gemini sur ce qui se passe. Par exemple, en regardant une vidéo de bricolage, j’ai pu demander « Quel outil utilise-t-il ? » et Gemini l’a identifié en se basant sur les éléments visuels. Il pourrait également identifier des composants spécifiques dans une vidéo technique ou même résumer des parties d’une vidéo que vous n’avez pas encore regardée, bien que cela soit plus fiable si la vidéo a des sections structurées.
Une autre astuce intéressante est d’extraire des informations spécifiques de vidéos, comme des recettes. Au lieu de mettre en pause et de noter les ingrédients et les étapes d’une démonstration culinaire, vous pouvez demander à Gemini d’extraire la recette pour vous. Cela permet d’économiser une quantité importante de temps et d’efforts.
Cette capacité s’étend au-delà des vidéos. En parcourant des sites d’achat comme Amazon, j’ai pu demander à Gemini de signaler des articles spécifiques mentionnés dans une annonce ou une description.
Si vous préférez parler plutôt qu’écrire, Gemini dans Chrome inclut une fonction « Live ». Appuyez sur le bouton, posez votre question à voix haute, et Gemini répondra à l’aide de la synthèse vocale.
Capture d'écran montrant Gemini résumant des listes de produits Amazon
Là où il est encore en rodage
En tant que fonctionnalité en accès anticipé, Gemini dans Chrome n’est pas encore parfait. J’ai rencontré certaines incohérences. En posant une question sur la localisation en temps réel d’une personne dans une vidéo, il a d’abord indiqué ne pas pouvoir accéder aux informations en temps réel, pour ensuite fournir la localisation à partir de la description de la vidéo lors d’une deuxième tentative. De même, demander un lien pour acheter un article spécifique montré dans une vidéo ne fonctionnait pas toujours, citant à nouveau un manque d’accès à l’inventaire en temps réel, bien qu’il puisse trouver des liens pour d’autres produits connexes.
Un autre problème mineur est la taille de la fenêtre Gemini. Sur les écrans d’ordinateurs portables plus petits, la fenêtre contextuelle peut sembler un peu grande, et les réponses de Gemini peuvent parfois être assez longues, nécessitant plus de défilement qu’idéal pour un rapide coup d’œil. Bien que vous puissiez agrandir la fenêtre, elle occupe un espace précieux à l’écran. L’IA est censée vous faire gagner du temps avec des réponses concises, et Gemini n’y parvient pas toujours, sauf si on lui demande spécifiquement. Les questions de suivi qu’il pose peuvent aussi sembler un peu répétitives.
Gemini extrayant une recette d'une vidéo YouTube dans Chrome
L’avenir passionnant : Devenir l’agent de votre navigateur
Malgré ces premiers accroc, le potentiel de Gemini dans Chrome est immense. Cette intégration semble être la base des plus grandes ambitions de Google en matière d’IA. Google s’efforce de rendre son IA « agentique », ce qui signifie qu’elle peut comprendre le contexte et effectuer des tâches pour vous.
Pensez aux possibilités : après avoir résumé le menu d’un restaurant, vous pourriez demander à Gemini de passer une commande à emporter directement. Ou, pendant que vous recherchez un voyage, vous pourriez lui demander de mettre automatiquement en signet les pages pertinentes ou d’enregistrer des vidéos YouTube utiles dans votre liste « À regarder plus tard ».
Le « Mode Agent » de Google, présenté en avant-première avec des projets comme Mariner, vise à ce que l’IA gère plusieurs tâches et recherche le web de manière proactive. L’intégration de ces capacités avancées à Gemini directement dans votre navigateur transformerait la façon dont nous interagissons avec Internet, en en faisant un environnement véritablement dynamique et utile. Bien que Gemini dans Chrome ne soit pas encore un agent à part entière, c’est un aperçu convaincant d’un avenir où votre navigateur ne se contente pas d’afficher des informations, mais vous aide activement à les utiliser.