Images réalistes et texte lisible avec les derniers modèles d'IA d'OpenAI. Essayez-le gratuitement.

OpenAI a intégré son modèle 4o dans ChatGPT pour permettre la génération d'images de manière native dans l'environnement du chatbot. Cette mise à jour élimine le besoin d'utiliser le modèle de génération d'images Dall-E d'OpenAI en tant qu'entité distincte, bien que Dall-E soit toujours disponible pour ceux qui le préfèrent. La société d'IA a également activé son générateur de vidéo Sora AI dans ChatGPT. 

Image générée par OpenAI - Une photo candide de style paparazzi de Karl Marx marchant précipitamment sur le parking du Mall of America.

Les nouvelles fonctionnalités sont actuellement disponibles pour les utilisateurs gratuits de ChatGPT, ainsi que pour les utilisateurs de ChatGPT Plus, Team et Pro. Ces fonctionnalités seront disponibles pour les utilisateurs professionnels et éducatifs la semaine prochaine.

Dall-E 3 était auparavant le plugin de génération d'images pour les abonnés payants de ChatGPT. En attendant, ceux qui souhaitent essayer le générateur gratuitement peuvent le faire via la version de base de Microsoft Copilot. 

Le modèle a été salué comme l’un des meilleurs générateurs d’images disponibles, en particulier dans sa version payante. Bien qu'il soit avantageux pour tous les utilisateurs de ChatGPT de pouvoir utiliser la génération d'images intégrée au modèle 4o, ceux qui utilisent la version gratuite de ChatGPT doivent être prêts à faire face à certaines limitations, telles que le téléchargement de fichiers et les limites d'analyse des données, comme indiqué. CNET

Cependant, ChatGPT bénéficiera d'images plus réalistes avec un texte plus clair après qu'OpenAI ait passé un an à former GPT-4o après son lancement grâce à un effort de formation appelé « Reinforcement Learning from Human Feedback » (RLHF), selon Wall Street Journal

Après l'annonce de GPT-4o en mai 2024, OpenAI a fait appel à une équipe de plus de 100 « formateurs humains » pour analyser le modèle à la recherche de fautes de frappe, ainsi que d'erreurs courantes dans les mains et les visages, a déclaré au journal le chercheur principal du projet, Gabriel Goh.

Le modèle GPT-4o ajoutera également la possibilité de créer des arrière-plans transparents à ChatGPT. Cela devrait être très utile pour les utilisateurs professionnels et les créatifs, car cela leur permettra de créer des logos ou d'autres icônes, comme l'a fait remarquer au WSJ Jackie Shannon, responsable des produits multimédias chez ChatGPT. 

Malgré les améliorations apportées par OpenAI, le modèle GPT-4o mis à jour dans son ensemble présente encore quelques lacunes. Il a toujours une tendance aux hallucinations, un trait commun à l'IA qui n'a pas encore été résolu. Maintenir la cohérence éditoriale reste un défi dans l’environnement ChatGPT ; Cependant, J'ai promis OpenAI avec des mises à jour rapides, dès la semaine prochaine. 

Un autre problème récurrent auquel OpenAI est confronté est celui de l’éthique et de la légitimité. L'entreprise insiste sur le fait que son modèle a été formé sur des « données accessibles au public », ainsi que sur des données exclusives qu'elle possède grâce à des partenariats avec des marques telles que Shutterstock, a noté le WSJ. 

Les images générées par ChatGPT basées sur le modèle 4o ne contiendront pas de filigranes AI. Cependant, la société a noté que les images incluront des métadonnées C2PA indiquant qu'elles ont été générées par l'IA. Cela reste la norme de l’industrie.

Les commentaires sont fermés.