Grok vs. Gemini dans 7 tests de génération d'images d'IA : lequel est le meilleur ?

Chaque générateur d’images a ses propres atouts.

Les générateurs d'images IA évoluent rapidement, devenant plus intelligents, plus rapides et plus créatifs. Après avoir testé les capacités de génération d'images de ChatGPT-5 et Gemini, j'ai souhaité comparer les performances de Gemini de Google à celles de Grok, le chatbot « gratuit » d'Elon Musk.

Gémeaux contre Grok, Grok contre Gémeaux

Lors d'une bataille en sept rounds, incluant des requêtes photoréalistes et inspirées de Pixar, j'ai testé le respect des instructions par chaque modèle et sa capacité à produire des images convaincantes. Voici les points forts de chacun et l'IA qui a finalement prévalu. Cette comparaison vous aidera à déterminer quel modèle, Gemini ou Grok, est le mieux adapté à vos besoins en matière de génération d'images par IA.

1. Concept de produit hyperréaliste

Capture d'écran de Grok vs. Gemini

Demandeur: « Créez une image photoréaliste d'un smartphone pliable et transparent affiché sur une table de café en bois, avec les lumières de la ville reflétées sur sa surface. »

Ça a marché Grok Pour répondre à cette demande, il a créé deux photographies réalistes reprenant tous les détails demandés. Les deux versions étaient soignées et reflétaient fidèlement le concept.

Le résultat était GEMINI Bien, mais pas parfait. Le smartphone transparent semblait un peu disproportionné, et les reflets des lumières de la ville, élément clé de l'affirmation, n'étaient pas rendus aussi convaincants que la tentative de Grok.

Gagnant: Victoires Grok Pour générer une image de haute qualité et interpréter au mieux les instructions, Grok a clairement surpassé les attentes lors de ce test de génération d'images par IA.

2. Dessiner des personnages avec des émotions

Capture d'écran de Grok vs. Gemini

Demandeur: « Dessinez une illustration de style bande dessinée d'un jeune astronaute qui se rend compte qu'il a oublié son casque sur Mars, avec une expression exagérée, des couleurs vives et un humour caricatural. »

Produire Grok Deux images de ce qui semble être des astronautes surpris, tous deux casqués. La proximité des images rend difficile toute interprétation précise, et l'oubli n'est pas très net.

Produire GEMINI Cette image représente un astronaute distrait. La bulle de pensée illustre mieux la raison de son inconfort, même si l'image serait plus réussie si l'astronaute ne portait pas de casque. L'arrière-plan et le design général sont clairs.

Gagnant : Gémeaux Des victoires pour avoir suivi les instructions de l'invite plus attentivement et pour une image plus comique.

3. Réimaginer l'histoire

Capture d'écran de Grok vs. Gemini

Demandeur: « Dessinez un tableau de style Renaissance représentant Cléopâtre tenant un smartphone moderne, dans le style de Léonard de Vinci. »

Produire Grok Cette image semble être une photographie d'une femme moderne vêtue de vêtements de style Renaissance et tenant un smartphone. Le tableau ressemble davantage à un selfie et est très moderne.

se concentrer GEMINI D'un point de vue plus artistique, le tableau ressemblait davantage à une peinture de la Renaissance et à Cléopâtre elle-même, plutôt qu'à une simple femme moderne dans son costume.

Gagnant : Gémeaux Il gagne pour sa meilleure interprétation de la demande et sa meilleure exactitude historique.

4. Scène de foule complexe

Capture d'écran de Grok vs. Gemini
Demandeur: « Créez une photo aérienne de Times Square le soir du Nouvel An, bondée de monde, avec des panneaux d'affichage lumineux et des confettis tombant dans le ciel nocturne. »

Grok Vraiment déçu par cette photo. Les deux photos étaient aussi mauvaises l'une que l'autre, un peu floues, et ne rendaient pas très bien le réveillon du Nouvel An à Times Square. Les gens étaient trop éloignés les uns des autres et d'autres détails pouvant suggérer le réveillon manquaient.

GEMINI Capturez l'énergie et la foule immense du réveillon du Nouvel An à Times Square. La photo provient clairement de New York, et les panneaux signalent l'événement. La foule est dense, contrairement à la photo de Grok.

Gagnant : Gémeaux Remporte la photo la plus claire et la plus précise du réveillon du Nouvel An à Times Square.

5. Mélange surréaliste

Capture d'écran de Grok vs. Gemini

Demandeur: « Imaginez une pieuvre géante jouant aux échecs avec Albert Einstein dans une chambre de verre au fond de l’océan. »

Rencontre Grok Difficulté avec ce test. Il a « réfléchi » beaucoup plus longtemps que tous les autres sujets du test jusqu'à présent. L'image était bonne, mais elle ne tenait pas compte du sujet « pièce vitrée ».

Ft GEMINI J'ai immédiatement pris une photo de ce qui semblait être un selfie. La serre était intéressante et réaliste. La pieuvre était beaucoup plus grande que celle de Grok et complétait mieux l'étrange image.

Gagnant : Gémeaux Gagnez avec une qualité d'image supérieure et des instructions précises.

6. Clarté de l'infographie

Capture d'écran de Grok vs. Gemini

Rapide: « Concevez une infographie claire qui illustre le cycle de vie d'un papillon, en étiquetant les étapes, en utilisant des flèches et des icônes plates avec le moins de couleurs possible. »

 

C'était une tentative Grok Créer un thème à la fois réussi et raté. La première version était trop chargée, avec un papillon superflu qui détournait l'attention du cycle de vie. La deuxième version était plus proche de l'objectif, mais manquait de précision dans les détails du cycle.

GEMINI Fournissez une image claire qui décrit avec précision le cycle de vie d’un papillon avec des étiquettes claires, peu de couleurs et des étiquettes faciles à lire.

 

Gagnant : Gémeaux Il a gagné, car il a réussi la réclamation du premier coup. L'image est précise et prête à être affichée.

7. Maintenez la cohérence dans les photos de profil stylisées.

Capture d'écran de Grok vs. Gemini

Demandeur: « Créez un modèle de personnage 3D de style Pixar d'un journaliste de 40 ans aux cheveux blonds tenant un carnet, puis créez 3 variantes avec des tenues différentes. »

Grok Il a complètement oublié la demande « style Pixar » dans cette invite, ainsi que la partie « tenues différentes ». Il a créé trois coiffures différentes, ce qui est tout à son honneur.

GEMINI Écrasez le journaliste à la manière de Pixar mais manquez les trois différences.

Gagnant : un match nul Les deux robots n'ont pas suivi les instructions. Si je devais en choisir un, ce serait Gemini, car il a su trouver le style parfait et mieux retranscrire l'esprit du journaliste.

Vainqueur général : Gemini

Après sept commandes, Gemini s'est avéré être le générateur d'images le plus fiable. Il suivait les instructions avec plus de cohérence et de précision, produisait des compositions plus nettes et maîtrisait des détails souvent négligés par Grok. Autrement dit, Gemini excellait dans la compréhension et l'exécution des commandes textuelles pour générer les images demandées.

Grok a certes fait preuve d'une créativité remarquable et a remporté une victoire éclatante en photoréalisme, mais il a souvent manqué de précision et s'est écarté de la norme. Si vous recherchez des résultats expérimentaux et originaux, Grok a ses atouts. Mais pour une utilisation quotidienne où clarté, précision et raffinement sont primordiaux, Gemini est le générateur d'images IA auquel je fais confiance. En bref, Gemini est un meilleur choix pour les utilisateurs recherchant des résultats cohérents et de haute qualité dans divers scénarios.

Avez-vous essayé Grok ? Et Gemini ? Lequel préférez-vous ? Dites-le-moi dans les commentaires.

Les commentaires sont fermés.