Выпуск DALL·E 3 — одно из важнейших событий в сфере генерации изображений. DALL·E 3 — последняя версия генератора изображений от OpenAI, создателя ChatGPT. ИИ-генератор DALL·E 3 значительно улучшил возможности интерпретации изображений и текста по сравнению со своим предшественником, DALL·E 2. Сегодня он доступен как в Bing Chat, так и в Bing Image Creator.
Что можно сделать с помощью DALL·E 3?
DALL·E 3 позволяет генерировать различные типы изображений, которые можно свободно использовать в дизайн-процессе. Все изображения, созданные с помощью DALL·E, принадлежат вам, включая право на перепечатку, продажу и атрибутику.
Вот несколько примеров изображений, которые я создал с помощью этого инструмента, а также промпты, которые при этом использовал.
Промпт: изображение человеческого сердца из полупрозрачного стекла, стоящего на постаменте среди бурного моря. Солнечные лучи пробиваются сквозь тучи, освещая сердце и крошечную Вселенную внутри него. На постаменте жирными буквами выгравирована цитата “Find the universe within you” (“Найди Вселенную внутри себя”).
Промпт: изометрическое изображение дома в мультяшном стиле.
Промпт: фотореалистичный портрет молодой девушки.
Почему стоит использовать DALL·E 3?
Почему стоит использовать DALL·E 3, когда уже есть такие мощные инструменты, как Midjourney и Stable Diffusion? На это есть три причины.
Во-первых, DALL·E 3 бесплатен для пользователей. Однако Bing предлагает ежедневные кредиты, которые можно использовать для генерации изображений. Есть и хорошая новость: генерация не прекращается после траты всех ежедневных кредитов — она просто становится медленнее.
Во-вторых, DALL·E 3 способен успешнее справляться со специфическими задачами, такими как добавление текста на изображения и совмещение двух символов на одном изображении.
Добавление текста к изображениям
Команда OpenAI отметила, что инструмент хорошо справляется с добавлением текста к изображениям.
Ниже приведен пример фотографии человека, держащего в руках текстовую табличку. Изображение создано мной с помощью DALL·E 3. Стоит заметить, что текст, сгенерированный этим инструментом, не всегда идеален, но все же лучше, чем текст, созданный Midjourney.
Объединение двух персонажей на одном изображении
Я использовал этот инструмент для совмещения Бэтмена и Человека-паука на одной картинке. Довольно интересно, что DALL-E 3 представил разговор между Бэтменом и Человеком-пауком в виде комикса.
Интеграция в ChatGPT
Что делает DALL·E 3 действительно мощным инструментом, так это интеграция в ChatGPT, заявленная OpenAI. Изображения можно будет создавать прямо в чате, используя модель компьютерного зрения GPT для анализа и изменения изображений, сгенерированных DALL·E 3.
Недостатки DALL·E 3
У этого инструмента есть несколько изъянов. В настоящее время процесс генерации изображений происходит не так быстро, как хотелось бы. Иногда может появиться сообщение об ошибке, уведомляющее о том, что генерация изображений недоступна из-за высокого спроса.
Еще одним недостатком является невозможность пользовательской настройки изображений. Генератор изображений предлагает опцию “Customise” (“Настройка”), но она ведет в Microsoft Designer, где сгенерированное изображение можно использовать в качестве дополнительного исходного материала для промпта. В Image Creator нельзя изменить изображение (например, удалить некоторые объекты с холста) или изменить соотношение сторон картинки.
Читайте также:
- Взгляд в будущее: перспективы развития и влияния ИИ на изобразительное искусство и повседневную жизнь
- Как преобразовать сгенерированные ИИ изображения в полигональные сетки
- Создаем ИИ с помощью OpenAI
Читайте нас в Telegram, VK и Дзен
Перевод статьи Nick Babich: DALL·E 3: AI Image Generator For Product Designers