Le mode IA recherche des images avec des descriptions conversationnelles

Les utilisateurs peuvent trouver le pantalon, le meuble ou la décoration de cuisine parfaits en décrivant simplement leurs besoins. Voici comment ça marche.

 

Après avoir agrandi Mode IA Google a annoncé un lancement dans plus de 180 pays hispanophones. actualización dans les fonctionnalités de l'outil : il permettra désormais explorer visuellement à travers des descriptions conversationnellesAutrement dit, les utilisateurs pourront décrire ce qu'ils imaginent, comme s'ils le racontaient à un ami, et obtenir naturellement des images et des produits associés.
Par exemple, si vous cherchez l'inspiration pour décorer une chambre dans un style « maximaliste », le mode IA vous montrera des images correspondant à cette « ambiance visuelle », et vous pourrez continuer à demander « plus de tons foncés ? », « plus de contraste ? » ou « des idées avec des motifs audacieux ? », sans avoir à appliquer de filtres manuels.

Mieux encore : vous pouvez lancer la recherche en fournissant une image (en la téléchargeant ou en prenant une photo) puis « converser » avec le mode IA à propos de ce que vous voyez.

Cela facilite la recherche de produits à acheter

Si un article vous intéresse, décrivez-le simplement. Par exemple : « jean coupe droite pas trop ample », et le mode IA vous proposera des options visuelles à l’achat. Si un article vous plaît, vous pouvez accéder directement au site web du vendeur.

Pour ce faire, Google dispose d'un Tableau d'achat plus que 50 milliards d'annonces de produits, qui vous permet de consulter les produits de magasins du monde entier, des grandes enseignes aux boutiques locales, chacun avec des détails tels que les avis, les dernières offres, les couleurs et la disponibilité. « Vous ne verrez que les résultats d'achat les plus récents, car plus de 2 milliards de ces fiches produits sont mises à jour sur Google toutes les heures. » l'entreprise explique.

Technologie des lentilles et puissance du Gemini 2.5

Pour parvenir à cette nouvelle fonctionnalité, Google combine son expertise en matière de recherche visuelle —avec Lens et recherche d'images— avec les capacités multimodales du modèle Gemini 2.5 Interpréter à la fois le langage et les images.

Le plus important, c'est qu'elle utilise une technique appelée « déploiement de la recherche visuelle » : Au lieu de simplement reconnaître le sujet principal d'une image, il génère de multiples requêtes sur les détails secondaires, le contexte, les objets supplémentaires et les nuances visuelles pour donner des réponses plus complètes.

Cela permet de mettre en valeur non seulement l'objet principal, mais aussi son environnement et ses relations visuelles.

De plus, la nouvelle modalité est intégrée de manière multimodale : Vous pouvez combiner texte et images, Continuez à vous poser des questions sur ce que vous voyez dans une image, et affinez progressivement votre recherche.

 

Photo : Google.
Modèle de fonctionnement du mode IA de Google

Pour l'instant, cette expérience visuelle conversationnelle est déployée en anglais aux États-Unis pour les utilisateurs du mode IA.

Article original de Noelia Fraguela | 02 octobre