OpenAI a intégré la génération d’images dans ChatGPT, avec une meilleure compréhension des requêtes
OpenAI a intégré la génération d’images directement dans ChatGPT. Le nouveau système fonctionne plus lentement, mais répond avec plus de précision et de qualité aux requêtes des utilisateurs.

Photo : pexels.com
OpenAI a introduit la génération d’images directement dans ChatGPT. Cette fonctionnalité repose sur le modèle omnimodal GPT-4o, capable de traiter du texte, des images, de l’audio et de la vidéo.
Cela permet une meilleure compréhension des requêtes utilisateurs et la création de scènes plus complexes.
Contrairement à DALL-E, le nouveau système utilise une approche autorégressive, où l’image est générée progressivement — ligne par ligne et de gauche à droite, à la manière de l’écriture d’un texte.
Bien que la génération prenne plus de temps, OpenAI estime que cela est justifié par la qualité. La limite gratuite reste la même que pour DALL-E, mais peut varier selon la charge du système.
Toutes les images sont accompagnées de métadonnées C2PA, sans filigranes visibles. La protection contre les abus a également été renforcée : les contenus nuisibles et les deepfakes sont bloqués.
Il a également été rapporté que OpenAI se prépare à lancer un nouveau modèle d’IA, "Strawberry", dans les deux semaines à venir, bien que sa sortie fût initialement prévue pour l’automne.
Les développeurs ont ajouté une pause de 10 à 20 secondes avant la réponse, afin d’améliorer la précision et l’analyse complexe.
Le modèle ne prend en charge que le texte, mais il peut mémoriser les conversations pour fournir des réponses personnalisées — bien que cette fonction soit encore instable. "Strawberry" sera intégré à ChatGPT comme une option distincte avec une limite de messages.