Искусственный интеллект который рисует по описанию
1. Выберите базовую модель: Stable Diffusion 1.5, Stable Diffusion 2.1, Stable Diffusion XL или Kandinsky 2.2. Затем можно выбрать конкретную модель или стиль изображения. Нейросети на основе SD 1.5: AbsoluteReality 1.8.1, Elldreth’s Vivid Mix, Anything V5, Openjourney V4, Analog Diffusion, Lyriel 1.6, Realistic Vision 5.0, Dreamshaper 8, Dreamlike Photoreal 2.0, epiCRealism v5, CyberRealistic 3.3, ToonYou Beta 6, Deliberate 3. Нейросети на основе Stable Diffusion XL: Stable Diffusion XL 1.0, Crystal Clear XL, Juggernaut XL, DreamShaper XL, SDXL Niji, Cinemax SDXL, NightVision XL. Разница между моделями описана ниже.
2. Введите в текстовое поле ниже описание изображения на русском или английском языке.
3. Чтобы получить хороший результат, детально опишите свою идею. Также можно поэкспериментировать с расширенными настройками. Negative prompt указывает на то, чего не должно быть на фото. Sampler — алгоритм для создания изображения. Параметр CFG Scale показывает, насколько сильно генерируемая картинка должна соответствовать описанию; низкие значения дают более креативные результаты. Steps — количество итераций при генерации. Высокие значения, как правило, дают более детализированные фото, но при этом увеличивается время обработки. С низкими значениями всё наоборот. Seed — случайное число для генерации. Вы можете выставить одно значение, чтобы, например, посмотреть, как разные алгоритмы Sampler генерируют одно изображение.
3. Нажмите кнопку «Сгенерировать изображение».
4. Разрешение полученных картинок можно увеличить в 2 или в 4 раза, нажав на соответствующую кнопку под ними. Время обработки — 15-25 секунд.
5. Для портретных фото также можно использовать функцию улучшения лица (устранение дефектов). Время обработки — 20-40 секунд.
Искусственный интеллект который рисует по описанию
Брейкданс Дарта Вейдера, падение астероида на Землю и животные в исторических костюмах — для искусственного интеллекта нет невозможного. Выбрали интересные проекты от Google, Сбера, NVIDIA и даже от бывшего инженера NASA, которые позволяют генерировать изображения по самым безумным описаниям — многие из них можно попробовать бесплатно.
Нейронные сети шагнули далеко вперед. Самая совершенная из них, DALL·E 2 от компании OpenAI (ее связывают с Илоном Маском), вот-вот бросит вызов творческим профессиям: иллюстраторам, фотографам и дизайнерам.
Ее суть в том, что она может создавать изображение по любому, даже самому безумному текстовому описанию. Начиная от «рестлеров в бальном платье эпохи Возрождения», заканчивая туристическими фотографиями Рыбинска. Результат получается порой впечатляющим.
Недавно бета-версия DALL·E 2 стала доступна онлайн — чтобы протестировать ее, нужно встать в лист ожидания и дождаться очереди. Если же хочется понять прямо сейчас, на что способны современные нейросети, составили подборку программ на базе ИИ, которые создают картинки по текстовому описанию. Одни из них идеально подходят для портретов, другие — для сюрреалистичного искусства и иллюстраций. Можете испытать их сами или посмотреть на картинки, которые сгенерировали мы.

Imagine — главный конкурент DALL·E 2
Компания Google (вернее, ее исследовательское отделение Google Brain) представила собственную нейросеть Imagine немногим позже DALL·E 2 — в мае 2022-го. Обучали ее на базе из 400 миллионов готовых пар изображений и текстовых описаний.
По словам разработчиков, Imagine работает лучше, чем детище OpenAI. Но верить приходится на слово — проект находится на экспериментальной стадии (и непонятно, когда из нее выйдет). Пока можно ознакомиться с примерами работ, либо попробовать небольшое демо на официальном сайте (нам предлагают составить запрос из нескольких готовых шаблонов).
Midjourney — самая художественная нейросеть
Проект одноименной независимой исследовательской лаборатории под руководством бывшего инженера NASA сейчас тоже на стадии бета-тестирования. Как и остальные, Midjourney относится к классу диффузионных нейронных сетей, то есть состоит как бы из двух нейросетей: одна отвечает за распознавание текста, другая — за генерацию изображений.
Инструмент быстро завоевывает популярность: с его помощью британский журнал The Economist создал обложку июньского номера 2022 года, а один из пользователей Reddit в августе перенес Гарри Поттера в мир киберпанка.
Midjourney называют более художественной нейросетью (в противовес DALL·E — более реалистичной), с ее помощью можно создавать сложные арты, удивляющие креативностью. Попробовать можно бесплатно в Discord (для этого нужно выбрать любую комнату в разделе Newcomer rooms, написать в чате /imagine и в строке promt вписать описание картинки на английском; если не поняли, вот инструкция).
ruDALL-E — российский ответ Илону Маску
Команда отечественных разработчиков (среди них сотрудники Sber AI) запустила российский аналог генератора в конце 2021-го, с тех пор нейросеть обзавелась несколькими вариациями:

DALL·E Mini — главный источник мемов
Еще одна программа, вдохновленная детищем OpenAI — ее создал энтузиаст из Техаса Борис Дайма для участия в конкурсе программистов. Сгенерировать картинку можно на сайте — вы получите сразу девять вариантов запроса не более, чем за две минуты. Правда, изображения в плане детальности уступают топовым проектам — нейронная сеть использует меньший набор параметров и обучена всего на 30 миллионах примеров, хотя создана на той же архитектуре, что и оригинальная DALL·E.
Не очень высокое качество отрисовки, тем не менее, не помешало проекту взорвать интернет. Довольно быстро появился форум на Reddit (сейчас там больше 100 тысяч подписчиков) и Twitter-сообщество (миллионник), где пользователи делятся самыми безумными вариантами генерации — нередко из них рождаются новые мемы (вот, например, Танос, который ищет свою маму в супермаркете Walmart, а вот Дарт Вейдер, попавший на камеру видеонаблюдения во время брейкданса).
В какой-то момент к DALL·E Mini обращались так часто, что компания Hugging Face — владелец серверов, на которых лежал проект — фиксировала по 50 тысяч генераций в сутки (команда не спала ночами, обслуживая нейросеть, пишет Wired). Популярность даже заставила разработчиков сменить название на Craiyon, чтобы алгоритм не ассоциировался с оригинальным проектом OpenAI.
Генерируем картинки с помощью ИИ StableDiffusion
![]()
В 2020 году появились первые публичные сервисы, позволяющие генерировать картинки с помощью текстового запросу к ИИ. Одними из таких ресурсов были HotPot AI и Artbreeder. В основе графических генераций стоят нейросети обученные на десятках миллиардов изображений.
StableDiffusion (SD) — один из ведущих искусственных интеллектов для генерации изображений
Отличительная черта SD — открытость, исходный код доступен, поэтому энтузиасты могут улучшать модель и вносить в неё новшества совместно.
Вы можете зарегиcтрироваться на указанных сайтах с помощью Google аккаунта и сразу же приступить к генерациям на последних версиях модели Stable Diffusion.
AI Art generator, AI Art Maker | dreamlike.art
Explore and make awesome AI-generated art with Stable Diffusion! Endless possibilities, a ton of features, convenient…
DreamStudio
DreamStudio by Stability AI is a new AI system powered by Stable Diffusion that can create realistic images, art
Как написать запрос на генерацию изображения в StableDiffusion?
Запросы пишутся на английском языке, если что используйте переводчики Google и DeepL.
Вариантов запросов существует бесконечное множество, но в общем, есть некоторые универсальные подходы.
Универсальная формула запроса к ИИ:
[Форма] + [Описание] + [Стиль]
[Форма] определяет в каком общем виде будет генерация.
например: иллюстрация (illustration), портрет (portrait), фотография (photo), граффити (graffiti), наскальная живопись…
[Что изобразить] что или кого рисовать ИИ.
например: дерево, космический корабль, рыцарь, Ленин, вечеринка на Гавайях, историческое событие, момент из кинофильма
[Модификаторы] часть запроса, которая указывает на стиль изображения и в целом может быть очень разнообразной.
например, в качестве модификатора можно использовать имя художника, в стиле которого вы хотите получить изображение (Пикассо, Малевич, Бэнкси)
также модификаторами могут служить обще-стилистические названия предметов искусства (в стиле… экспрессионизм, брутализм, абстракция, сюрреализм)
На сайте lexica.art можно ознакомится с галлерей сгенерированных изображений и подобрать подходящие слова для своего запроса
Что такое Guidance Scale (CFG), Steps (denoising), Aspect Ratio
Guidance Scale (CFG Scale) отвечает за то, насколько искуственный интеллект должен приблизиться к буквальному изображению запроса. Чем ниже Cfg Scale — тем креативнее будет ИИ. Чем выше Cfg Scale тем более точно ИИ будет пытаться изобразить запрос.
Steps (denoising) отвечает за то, сколько раз (итерации) ИИ должен улучшить изображение перед завершением генерации. Чем выше настройка Steps (denoising), тем будет выше качество готового изображения. Ставим на максимум.
Aspect Ratio. Вы можете указать пропорции генерируемого изображения: Square (1:1), Portrait (3:4), Landscape (4:3), Mobile (9:16), Desktop (16:9)
Нейросеть рисует: 5 способов создать картинку по фото или описанию

Возможности искусственного интеллекта используют не только в серьезных, но и в развлекательных целях. Существует целый ряд сервисов, которые способны сгенерировать картинки по текстовому описанию. РБК Тренды подготовили подборку таких сервисов и протестировали их, попросив нарисовать одно и то же. Запрос выглядел так: «space dolphin earth pink blue metaverse music» («космос дельфин Земля розовый синий метавселенная музыка»).

DALL-E Mini
- зайти на официальный сайт Dall-E Mini через ресурс Hugging Face;
- найти раздел dall-e;
- ввести текстовое описание на английском языке, разделяя слова пробелами;
- нажать Run;
- когда изображение будет сгенерировано, понадобится сделать снимок экрана, чтобы сохранить всю подборку, или сохранить каждую картинку по отдельности.
Нейросеть в начале 2021 года представила компания Илона Маска OpenAI. Разработчики обучили ее создавать изображения из коротких текстовых подписей. Приложение работает на основе другой модели генерации текста от OpenAI — GPT-3. Она обучена на 12 млн параметров и способна создавать антропоморфные версии животных и объектов, объединять в картинке несвязанные концепции, подбирать текст для существующих изображений. Название программы отсылает к художнику-сюрреалисту Сальвадору Дали и персонажу Wall-E из одноименного мультфильма. В 2022 году команда выпустила версию DALL-E 2, которая генерирует реалистичные изображения, но пока она недоступна широкому кругу пользователей и компаний.
ruDALL-E Kandinsky
Как попробовать ruDALL-E Kandinsky:
- зайти на официальный сайт нейросети;
- выбрать «Попробовать»; текстовое описание в окне через пробелы на русском языке;
- ввести код подтверждения;
- скачать готовую картинку или поделиться ею в соцсетях через специальную кнопку.
Также можно посмотреть варианты сгенерированных для других пользователей картинок по похожим запросам (по нашему таких не нашлось).

Нейросеть в 2021 году разработало подразделение SberAI совместно со SberDevices, Самарским университетом, AIRI и SberCloud. Оно работает на базе программного обеспечения DALL-E, но генерирует картинки по описанию на русском языке. В открытом доступе уже есть модели генератора — ruDALL-E Malevich (XL), которая генерирует картинки в стиле Малевича; Sber VQ-GAN, которая генерирует изображения в хорошем разрешении; ruCLIP Small для ранжирования изображений и подписей, а также Super Resolution (Real ESRGAN) для генерации в супервысоком разрешении.
В 2022 году SberAI выпустила большую модель ruDALL-E Kandinsky, обученную на 12 млрд параметров. Она доступна в приложении «Салют» от SberDevices и в боте Discord. По словам разработчиков, генерация изображений учитывает точное описание желаемого и создает уникальные изображения, которые раньше не существовали. Их можно использовать для иллюстраций статей, а также в копирайтинге и рекламе.

Midjourney
- зарегистрироваться на платформе для геймеров Discord;
- зайти на официальный сайт Midjourney и авторизоваться через Discord;
- перейти в один из ботов newbie и ввести в поле для отправки сообщения команду /imagine;
- ввести описание на английском языке в плашке Prompt;
- кликнуть «Отправить»;
- появятся четыре картинки, после этого можно воспользоваться кнопкой U, чтобы улучшить разрешение одной из них, или кнопкой V, чтобы создать еще четыре вариации выбранной картинки;
- нажать на понравившуюся картинку и выбрать «Открыть оригинал», а затем сохранить ее, также можно сохранить весь коллаж.
Эту нейросеть разработала одноименная американская компания, которую основал ученый и бывший сотрудник Института Макса Планка Дэвид Хольц. В середине июля 2022-го Midjourney вышла в фазу бета-тестирования и стала доступной для пользователей по всему миру. В бесплатной версии можно сгенерировать 25 сетов в низком разрешении или меньше, так как попытки улучшить изображения засчитываются как новая попытка генерации. По сравнению с конкурентами Midjourney обеспечивает более высокое разрешение итоговых картинок и большую детализацию в соответствии с текстовым запросом.
Starryai
- перейти на сайт Starryai, кликнуть «Start Creating»;
- пройти верификацию через Google или Apple;
- выбрать опцию Altair или Orion;
- в окне Prompt ввести текстовое описание на английском языке;
- в окне появится картинка, которая будет преобразовываться прямо на глазах;
- кликнуть на готовое изображение и выбрать Download, также можно поделиться картинкой в соцсетях или даже создать из нее анимацию.
Нейросеть создает картинки на основе текстового описания, но с дополнениями. В режиме Altair можно создать сказочное изображение, которое будет представлять собой более абстрактные художественные рендеры ИИ. В режиме Orion можно создавать более сложные и кинематографичные изображения, смешивая до трех стилей. Для генерации используется система кредитов, которые можно не только купить за деньги, но и заработать — посмотреть рекламу или поделиться работой в соцсетях. Для уже готового изображения доступна опция увеличения разрешения за дополнительные кредиты.
Dream by WOMBO
- зайти на сайт Dream;
- в окне Prompt вбить текстовое описание на английском языке;
- выбрать стиль картинки и кликнуть Create;
- нажать Save, также можно повторить попытку генерации, нажав Generate Again.
Сервис от канадского стартапа WOMBO позволяет создавать вертикальные обложки. При этом можно выбрать режим («Мистический», «Барокко», «Фэнтези» и так далее) и прикрепить картинку-референс, а также собственный NFT (невзаимозаменяемый токен). Нейросеть выдает абстрактные результаты. Генерация картинки происходит в режиме реального времени. Веб-версия сервиса бесплатна.
В мае 2022 года Google также показала свою нейросеть Imagen, которая генерирует изображения на основе текста методом диффузии: начинает со схематичного изображения и улучшает его. Сначала Imagen создает изображение 64×64 пикселя, но потом доводит его до 1024×1024 пикселя. В итоге картинка получает настолько высокую детализацию, что ее можно принять за фотоснимок.

Сначала Google открыла свой сервис для ограниченного бета-тестирования, но теперь оно, похоже, закрыто. Видимо, в ближайшем будущем Imagen станет общедоступным.