OpenAI добавила в ChatGPT генерацию изображений с улучшенным пониманием запросов
OpenAI встроила генерацию изображений прямо в ChatGPT. Новая система работает медленнее, но точнее и качественнее реагирует на пользовательские запросы.

Фото: pexels.com
OpenAI внедрила возможность генерации изображений непосредственно в ChatGPT. Функция основана на омниомодальной модели GPT-4o, способной обрабатывать текст, изображение, аудио и видео.
Это позволяет точнее распознавать пользовательские запросы и создавать более сложные сцены.
В отличие от DALL-E, новая система применяет авторегрессионный подход, при котором изображение создаётся постепенно — по строкам и слева направо, аналогично написанию текста.
Хотя генерация занимает больше времени, OpenAI считает это оправданным ради качества. Бесплатный лимит остался как у DALL-E, но может меняться в зависимости от нагрузки.
Все изображения снабжены C2PA-метаданными, без визуальных водяных знаков. Защита от злоупотреблений также усилена: блокируются фейки и вредный контент.
Ранее сообщалось, что OpenAI готовится запустить новую AI-модель "Strawberry" уже в ближайшие две недели, хотя релиз был намечен на осень.
Разработчики добавили 10–20-секундную паузу перед ответом, чтобы повысить точность и улучшить сложный анализ.
Модель поддерживает только текст, но умеет запоминать разговоры для персонализированных ответов — хотя эта функция пока нестабильна. "Strawberry" станет частью ChatGPT как отдельная опция с ограничением по числу сообщений.