Création visuelle 23 avril 2026

ChatGPT Image V2 détruit NanoBanana : le monstre des images est arrivé

OpenAI vient de sortir son nouveau modèle d'images. Zéro faute de texte, compositions parfaites, try-on, changement de perspective 3D : je l'ai poussé sur 15 tests.

L

Léo Lumina

Consultant IA & E-commerce

ChatGPT Image V2 détruit NanoBanana : le monstre des images est arrivé

ChatGPT Image V2 en 30 secondes

OpenAI vient de sortir son nouveau modèle d’image, et c’est un monstre de précision. Pour rappel, il y a quelques semaines je comparais déjà Flux 2 vs NanoBanana sur des photos produits — à l’époque NanoBanana dominait. Aujourd’hui, la donne change complètement.

Les trois points qui comptent pour un e-commerçant :

  • Le texte est parfait : 100 illustrations sur une grille 10×10, zéro faute d’orthographe. C’est historique.
  • Le changement de perspective 3D fonctionne (vue en plongée → vue au sol, respecte l’environnement).
  • Les refusals de NanoBanana disparaissent : tu peux enfin reproduire une pose depuis une référence, générer un personnage sur un produit, faire un try-on — sans te taper “désolé, je ne peux pas” toutes les 30 secondes.

Concrètement : pour un e-commerçant, ça veut dire des visuels produits, pubs, miniatures YouTube et fiches articles que tu peux générer en un prompt, sans photoshop, sans studio.

15 tests, 15 domaines où ça change la donne

1. Le stress test “texte” (grille 10×10 d’objets en forme de L)

Je demande une grille de 100 illustrations, chacune un objet différent dont la forme rappelle la lettre L, avec le nom de l’objet en légende. Résultat : 100 illustrations propres, 100 légendes sans faute. Pour référence, les modèles il y a 6 mois mettaient des “Lammp” à la place de “Lamp”.

Ce que ça change pour toi : des infographies produits avec du texte dense (ex. “comparatif de 12 modèles”, “caractéristiques techniques en pictos”) — plus besoin d’un graphiste pour relire 40 fois.

2. Affiche publicitaire dans le métro

Le texte est incliné exactement comme sur l’affiche physique, avec le bon style typo, le bon contraste. Copier-coller pour une campagne de com locale sans passer par Photoshop.

3. Reproduction de pose depuis une référence

Tu lui files une photo de pose (genre “personnage assis en tailleur face caméra”), tu lui demandes de la reproduire avec ton personnage de marque. Il reproduit la pose sans refusal, alors que NanoBanana bloquait 9 fois sur 10 avec “je ne peux pas reproduire des images de personnes”.

4. Changement de perspective 3D

Je lui donne une capture d’écran d’Age of Empires (vue isométrique d’une carte) et je lui demande une vue au sol dans le même univers. Il comprend la topologie, respecte les bâtiments visibles, génère la vue sol cohérente. Pour un shop c’est une révolution : tu as une photo produit en plongée, tu lui demandes une vue de face ou une mise en situation → il te la génère avec la même identité.

5. Composition produit (vs Gemini NanoBanana)

Test direct : un gel douche sur un fond tropical avec un personnage qui l’utilise. Gemini NanoBanana sort un truc correct mais figé, les mains du personnage ne tiennent pas vraiment le produit, le packaging est flou. ChatGPT Image V2 : tout est cohérent, le produit est net, la main tient bien le flacon, la lumière matche. Game over.

6. Try-on de vêtements (même loufoques)

Tu lui donnes ton personnage de marque en tenue de base, puis une photo d’un pyjama dinosaure. Il te sort ton personnage en pyjama dinosaure, pose conservée, identité visuelle respectée. Pour un shop mode, c’est l’outil de pré-visualisation que tu attendais depuis 2 ans.

7. Continuation d’image (étendre les bords)

Un portrait cadré serré → tu lui demandes d’étendre le décor sur les côtés. Il continue la scène de manière cohérente (la bibliothèque derrière continue, les meubles sont logiques). Utile pour passer d’un format Instagram carré à un format Pinterest vertical sans refaire la photo.

8. Personnage → figurine réaliste

Tu lui donnes une photo de personnage (ou ton avatar), tu demandes “figurine Funko Pop de ce personnage”. Il te sort une 3D réaliste avec plastique brillant, ombres cohérentes, et même la base noire. Pour le merchandising IA : énorme.

9. Affiche cinéma années 80

Style pixel/grain, typographie cohérente, visages des acteurs respectés. Parfait pour des pubs nostalgiques ou du contenu rétro-gaming.

10. Logo à partir d’un croquis crayon

Tu griffones un logo sur un papier, tu photographies, tu demandes “version vectorielle propre en couleurs de marque violet et navy”. Il te sort le logo propre, fond transparent, prêt à être utilisé. Plus besoin d’Illustrator pour itérer sur 10 variantes.

11-12. Carte Pokémon + packaging produit

Cohérence des éléments graphiques, texte parfait, compositions layers (personnage + fond + cadre + stats). Pour les fiches produit en mode collector ou des animations de lancement : idéal.

13. Le journal des années 80 (stress test texte long)

Une page entière de journal, texte dense, images insérées. Tout est lisible, cohérent, la mise en page tient. Si tu fais des catalogues PDF avec de l’IA, tu peux commencer à imaginer des mises en page complètes générées.

14. Canvas : deux personnages dans deux poses précises

Ici le modèle gère la composition à plusieurs — deux personnages distincts, deux poses, une interaction crédible entre eux. C’est là qu’on se rapproche des usages “shooting photo sans shooting”.

15. Miniature YouTube dans mon style

Je demande une miniature dans le style Leo Lumina (visage en gros plan, titre rouge, flèche qui pointe sur un produit). Résultat : utilisable directement. Pour les e-commerçants qui font du contenu YouTube/Shorts, ça remplace 30 min de Photoshop par 30 secondes de prompt.

Ce qui ne marche pas (encore)

Soyons honnêtes :

  • Sur des visages connus (photoréalisme d’une personne existante), le modèle freine encore — logique, question légale.
  • Le rendu de mains reste parfois étrange sur les poses complexes (les vieux démons des IA d’image).
  • Il n’est pas open source — contrairement à Flux ou aux modèles open source que je teste régulièrement, tu ne peux pas le self-host ni le fine-tuner sur ta marque.
  • Tarifs OpenAI : à surveiller si tu génères en volume (une agence qui fait 10 000 visuels par mois verra passer la facture).

Comparaison directe avec NanoBanana

Sur les 5 tests où j’ai comparé côte à côte, ChatGPT Image V2 a gagné 5 fois. NanoBanana n’a pas dit son dernier mot (une v2.1 est annoncée), mais pour l’instant le roi de l’image IA, c’est OpenAI.

Le retour de bâton positif pour nous : quand OpenAI tape fort, Google doit répondre. Donc la prochaine version de NanoBanana sera encore meilleure. Et toi, tu as des outils de plus en plus dingues pour tes visuels.

Verdict : à essayer cette semaine si tu vends en ligne

Pour un e-commerçant solo ou une petite équipe, l’intérêt est évident :

  • Visuels produits : fin des shootings pour les produits accessoires / déclinaisons couleur.
  • Pubs sociaux : tu génères 20 variantes d’une créa en 30 min.
  • Miniatures YouTube / Shorts : tu tournes ton contenu plus vite.
  • Fiches produit immersives : mises en situation, try-on, ambiances.

Si tu faisais encore tes visuels à la main en 2026, c’est le moment de basculer.

Pour tester :


Dans la même veine sur le blog : Flux 2 vs NanoBanana sur les photos produits · Lyria 3 Pro : la musique IA incluse dans Gemini · Voxstral : l’alternative gratuite à ElevenLabs · Google Figma killer gratuit.

Tu veux industrialiser tes visuels produits avec l’IA ? Prenons rendez-vous pour construire ton workflow — ou parcours le blog pour d’autres tests d’outils IA.

Partager : Lien copié !

Envie d'échanger sur votre projet IA ?

Discutons-en lors d'un appel découverte gratuit.

Prendre rendez-vous