Ни для кого уже не секрет, что нейросети, позволяющие улучшать и генерировать изображения, уже не просто набирают популярность, а более того, прочно обосновываются в нашей жизни.
Для многих подобные платформы представляют собой источники креатива в рамках дизайна, рекламы и в принципе всевозможного цифрового контента. Любой желающий может воспользоваться одним из десятков сервисов, чтобы быстро и порой даже бесплатно сгенерировать изображение на любой вкус и цвет. Среди таких особо пользуются спросом Midjourney, Kandinsky от SberAI, «Шедеврум» от «Яндекса» и DALLE-E от гиганта ИИ-технологий OpenAI. На последнем мы и остановимся в этой статье.
В конце 2023 года OpenAI анонсировали улучшенную версию нейросети и заявили, что в ближайшее время намерены интегрировать генератор в ChatGPT. Согласно пресс-релизу, DALL-E 3 (это и есть последняя версия нейросети) нацелена на более релевантное понимание запросов, анализ громоздких инструкций и создание «чрезвычайно детальных и точных изображений» по сравнению со своим предшественником.
А что касается конкурентов, то, если верить заявлениям компании, у DALL-E 3 и вовсе равных нет.
«Современные генераторы изображений зачастую игнорируют слова и описания, вынуждая пользователей изучать промпт-инженерию. DALL-E 3 представляет собой шаг вперёд в нашей способности создавать изображения, которые точно соответствуют предоставленному вами запросу», — сообщается в описании новой версии нейросети.
Разбираемся, какие новые фичи представлены в DALL-E 3 и чем нейронка действительно может похвастаться на фоне конкурентов.