Выпуск DALL·E 3  —  одно из важнейших событий в сфере генерации изображений. DALL·E 3  —  последняя версия генератора изображений от OpenAI, создателя ChatGPT. ИИ-генератор DALL·E 3 значительно улучшил возможности интерпретации изображений и текста по сравнению со своим предшественником, DALL·E 2. Сегодня он доступен как в Bing Chat, так и в Bing Image Creator.

Что можно сделать с помощью DALL·E 3?

DALL·E 3 позволяет генерировать различные типы изображений, которые можно свободно использовать в дизайн-процессе. Все изображения, созданные с помощью DALL·E, принадлежат вам, включая право на перепечатку, продажу и атрибутику.

Вот несколько примеров изображений, которые я создал с помощью этого инструмента, а также промпты, которые при этом использовал.

Промпт: изображение человеческого сердца из полупрозрачного стекла, стоящего на постаменте среди бурного моря. Солнечные лучи пробиваются сквозь тучи, освещая сердце и крошечную Вселенную внутри него. На постаменте жирными буквами выгравирована цитата “Find the universe within you” (“Найди Вселенную внутри себя”).

Изображение человеческого сердца, созданное с помощью DALL·E 3

Промпт: изометрическое изображение дома в мультяшном стиле.

Изометрическое изображение дома, созданное с помощью DALL·E 3

Промпт: фотореалистичный портрет молодой девушки.

Фотореалистичный портрет молодой девушки, созданный с помощью DALL·E 3

Почему стоит использовать DALL·E 3?

Почему стоит использовать DALL·E 3, когда уже есть такие мощные инструменты, как Midjourney и Stable Diffusion? На это есть три причины.

Во-первых, DALL·E 3 бесплатен для пользователей. Однако Bing предлагает ежедневные кредиты, которые можно использовать для генерации изображений. Есть и хорошая новость: генерация не прекращается после траты всех ежедневных кредитов  —  она просто становится медленнее.

Ежедневные кредиты, отображаемые рядом с окном промптов

Во-вторых, DALL·E 3 способен успешнее справляться со специфическими задачами, такими как добавление текста на изображения и совмещение двух символов на одном изображении.

Добавление текста к изображениям

Команда OpenAI отметила, что инструмент хорошо справляется с добавлением текста к изображениям.

Изображение с текстом, сгенерированное DALL·E 3: пациент-авокадо жалуется терапевту-ложке: “Я чувствую себя таким опустошенным”. Изображение от OpenAI

Ниже приведен пример фотографии человека, держащего в руках текстовую табличку. Изображение создано мной с помощью DALL·E 3. Стоит заметить, что текст, сгенерированный этим инструментом, не всегда идеален, но все же лучше, чем текст, созданный Midjourney.

Изображение с текстом, созданное с помощью DALL·E 3

Объединение двух персонажей на одном изображении

Я использовал этот инструмент для совмещения Бэтмена и Человека-паука на одной картинке. Довольно интересно, что DALL-E 3 представил разговор между Бэтменом и Человеком-пауком в виде комикса.

Изображение, созданное с помощью DALL·E 3

Интеграция в ChatGPT

Что делает DALL·E 3 действительно мощным инструментом, так это интеграция в ChatGPT, заявленная OpenAI. Изображения можно будет создавать прямо в чате, используя модель компьютерного зрения GPT для анализа и изменения изображений, сгенерированных DALL·E 3.

Как будет работать DALL·E 3 в ChatGPT

Недостатки DALL·E 3

У этого инструмента есть несколько изъянов. В настоящее время процесс генерации изображений происходит не так быстро, как хотелось бы. Иногда может появиться сообщение об ошибке, уведомляющее о том, что генерация изображений недоступна из-за высокого спроса.

Самая быстрая генерация изображений заняла около 10 секунд. В процессе генерации Bing дает ценные советы

Еще одним недостатком является невозможность пользовательской настройки изображений. Генератор изображений предлагает опцию “Customise” (“Настройка”), но она ведет в Microsoft Designer, где сгенерированное изображение можно использовать в качестве дополнительного исходного материала для промпта. В Image Creator нельзя изменить изображение (например, удалить некоторые объекты с холста) или изменить соотношение сторон картинки.

Опция “Customize” ведет в Microsoft Designer
Microsoft Designer может использовать изображение, сгенерированное Bing Image Creator, в качестве дополнительного ввода

Читайте также:

Читайте нас в Telegram, VK и Дзен


Перевод статьи Nick Babich: DALL·E 3: AI Image Generator For Product Designers

Предыдущая статьяКлючевые вопросы для собеседования по Spring Boot в 2023 году. Часть 2
Следующая статьяЧистая архитектура фронтенда