Нейросеть которая делает из картинки человека
Перейти к содержимому

Нейросеть которая делает из картинки человека

  • автор:

Нейросети аниме – превращаем любое фото в аниме картинку

Одно из направлений, для которых пользователи сети могут использовать нейросети, – аниме, точнее стилизация под него своих или чужих фото. Благодаря развитию технологий появляется все больше сервисов с разными возможностями и особенностями использования.

Me In Comics

Китайская нейросеть от разработчиков облачного хранилища Tencent и соцсети QQ. Me In Comics превращает в аниме любое фото с изображением человека, животного, пейзажа и даже мема. Она отличается специфическим для русскоязычных пользователей интерфейсом. Для работы может также потребоваться VPN.

Заходить на сайт лучше с мобильного устройства. При работе через браузер ПК многие кнопки нейросети оказываются за пределами экрана, поэтому придется делать окно браузера вертикальным. Также для создания аниме можно использовать бот в Телеграм @amanimeBot.

Преобразовать фото с помощью Me In Comics можно в несколько шагов:

  • перейти на сайт, используйте при этом только японский VPN. Получить VPN можно здесь.
  • можно использовать бесплатные Телеграм-боты, который работают на API Me In Comics: Anime AI 2D, Anime AI, Anime AI!
  • нажать Play now (кнопка с градиентной заливкой внизу экрана);
  • загрузить изображение через кнопку Album.

Результат появится на экране примерно через 15 секунд в виде видео, демонстрирующего преображение исходника в анимешное изображение. Последнее также можно сохранить. Нейросеть практически не заимствует у исходника черты лица, но хорошо «замечает» детали и воспроизводит их на итоговой картинке (сохраняет позу, прическу, одежду, аксессуары).

Плюсы:

  • создание оригинальных, хорошо проработанных аниме-изображений;
  • разнообразие стилей и настроек;
  • бесплатное использование без регистрации.

Минусы:

  • неадаптированный к работе на ПК интерфейс;
  • иногда получается совсем небольшое сходство результата с оригиналом;
  • для создания качественного изображения иногда требуется несколько попыток.

Different Dimension Me Online

Еще одна популярная нейросеть, которая делает из фото людей картинки в стиле аниме. Обработка фото животных дает еще более интересные результаты. Также у нее неплохо получаются мемы, но на сгенерированных картинках всегда отсутствует алкоголь.

Чтобы получить аниме-арт, нужно:

  • перейти на сайт и нажать Get started for free;
  • загрузить свое фото в левом блоке;
  • выбрать вариант обработки: version 1 (более анимешный) или version 2 (более реалистичный);
  • нажать «Submit».

Обычно нейросеть Different Dimension Me Online рисует аниме за несколько секунд.

Плюсы:

  • полностью бесплатный доступ;
  • в процессе обработки нейросеть не кадрирует фото или обрезает его минимально.

Минусы:

  • для хорошего результата иногда требуется несколько попыток;
  • нейросеть иногда упускает черты лица, не всегда справляется с общим планом и мелкими деталями, превращая их кашу.

Meitu

Название Meitu прежде всего ассоциируется с продвинутым фоторедактором. Но благодаря функции AI Art, он также приобрел популярность как нейросеть, которая делает из картинок аниме. Для использования можно скачать приложение из Google Play или App Store. Также можно работать в веб-версии, но придется автоматически переводить страницу с китайского языка.

Для запуска процесса генерации в мобильном приложении нужно:

  • нажать на кнопку AI Art с иконкой робота;
  • загрузить изображение из галереи;
  • подтвердить начало генерации.

В бесплатной мобильной версии нейросеть делает только 3 картинки аниме из одного фото. Результат предлагается в виде коллажа. Внимание в них акцентируется на сохранении человека, деталей одежды, интерьера, но не сопутствующих предметов. Далее предлагается оплатить vip-тариф (месячная стоимость от $2,62 при оформлении годовой подписки) с неограниченным количеством генераций. Также можно воспользоваться бесплатным 7-дневным пробным периодом.

При использовании веб-версии Meitu выдает результат с водяными знаками. Изображения нельзя скачать, но можно применить различные фильтры.

Плюсы:

  • превращение фото в аниме без потери деталей;
  • возможность работать в браузере и в мобильном приложении.

Минусы:

  • иногда плохое распознавание эмоций;
  • плата за использование.

AnimeGAN

Нейросеть AnimeGAN – разработка китайских студентов, которая превращает в аниме практически любое фото – человека, животного или невоодушевленных предметов. При этом сохраняется узнаваемость исходных изображений.

Алгоритм создания аниме из фото предельно простой:

  • перейти на сайт;
  • загрузить исходное фото;
  • выбрать размер готовой картинки;
  • запустить генерацию.

Обработка фото занимает до 30 секунд. Если для работы используется слабый ПК, лучше не задавать нейросети максимальное качество для итогового изображения аниме, поскольку устройство может не справиться с задачей.

Плюсы:

  • простота использования;
  • хорошее качество генерируемых изображений;
  • относительное сходство с исходником;

Минусы:

  • отсутствие каких-либо настроек при обработке.

Selfie2anime

Одна из самых простых в использовании нейросетей, которая делает фото в стиле аниме. Она работает на базе алгоритмов машинного обучения с генеративной состязательной сетью (подразумевается одновременное использование двух нейронных сетей, одна отвечает за создание образов, вторая – проверяет их правильность или неправильность) от компании NCSoft, разработчика популярной игры Lineage II. Все операции выполняются без участия пользователя, поэтому вмешаться в процесс обработки и задать какие-либо дополнительные настройки не получится.

Чтобы сгенерировать в Selfie2anime аниме-персонажей на основе фото, нужно:

  • перейти на сайт;
  • загрузить фото и обрезать его во встроенном редакторе;
  • указать e-mail;
  • запустить генерацию.

Создание готовой картинки занимает считанные минуты. На указанную почту приходит письмо от selfie2anime со ссылкой на страницу с результатом. Последний иногда получается неплохим, иногда – слишком абстрактным и даже пугающим. По отзывам нейросеть лучше рисует аниме с женскими персонажами. За один раз можно сгенерировать только одну картинку. Но ограничений по количеству генераций нет.

Плюсы:

  • простота меню;
  • отсутствие ограничений на количество генераций.

Минусы:

  • иногда непредсказуемые результаты (отсутствующие глаза или пальцы).

Lensa

Приложение от российской компании Prisma Labs, где нейросеть делает стилизованные арты аниме по загруженным фото благодаря функции Magic Avatars. Но за ее использование придется заплатить (сам фоторедактор бесплатный).

Lensa можно скачать в Google Play или App Store. Для запуска генерации нужно загрузить 10-20 фотографий, соответствующих рекомендациям на экране (присутствие только одного человека, разные выражения лица, ракурсы, фоны и др.). Чем точнее им следовать, тем лучше будет итоговый результат. Приложение может сгенерировать 50-200 изображений, которые обойдутся 189-429 руб. для устройств Android или 279-649 руб. для устройств iOS. Это разовая оплата. При желании сгенерировать другие картинки, нужно будет снова оплатить соответствующую сумму.

10 самых популярных нейросетей для создания картинок

Нейросети умеют рисовать реалистичные портреты и фантастические арты в любом стиле: от комикса до картин Ван Гога. Благодаря этому они упрощают работу многим специалистам. Особенно дизайнерам, SMM-специалистам и маркетологам. Ведь готовые изображения можно использовать для оформления статей, публикаций в соцсетях, рекламных баннеров.

Алгоритмы создают картинки по текстовому запросу, по загруженной фотографии или с использованием обоих вариантов. Протестировали 10 самых популярных нейросетей и рассказываем о них.

10 самых популярных нейросетей для создания картинок

Ада Реинер

Для работы с сервисами искусственного интеллекта важно научиться грамотно составлять промпты — текстовые запросы, которые служат нейросетям короткими инструкциями.

В статье «Как составлять промпты для нейросетей: гайды от экспертов» три эксперта по работе с ИИ — художник, руководитель новостного портала и предприниматель — рассказали, как они настроили нейросети, чтобы те эффективно помогали им в работе.

Lexica

Lexica позволяет создавать только 16 изображений в месяц бесплатно. Это не так много, потому что по одному запросу нейросеть генерирует четыре варианта, которые списываются из лимита.

Чтобы научиться составлять хорошие промпты, стоит изучить медиатеку сгенерированных изображений от Lexica. Здесь можно вдохновиться идеями и скопировать составленные другими пользователями текстовые запросы.

Для работы в Lexica нужно войти в аккаунт Google, ввести промпт в поисковую строку и нажать «Генерировать». Интерфейс будет понятен даже тем, кто только начинает познавать миры нейросетей.

10 самых популярных нейросетей для создания картинок

Картинки получаются контрастными, в хорошем качестве, без проблем с анатомией, но не очень реалистичные, даже с указанием photoreal. Если не требуется сильная реалистичность, Lexica отлично подойдёт для создания иллюстраций, которые можно использовать в дизайне баннеров, обложек, рекламных плакатов.

Преимущества:

  • не нужно использовать VPN;
  • простой интерфейс;
  • быстро генерирует изображения — около 10 секунд;
  • в медиатеке можно скопировать промпты;
  • любой арт из поиска можно скачать и добавить в понравившиеся;
  • по умолчанию Lexica создаёт вертикальные картинки с разрешением 768×1152, в бесплатной версии можно изменить размер на меньший или ориентацию на горизонтальную, больше возможностей по платной подписке;
  • есть возможность редактирования сгенерированных изображений;
  • можно использовать на мобильном устройстве, есть приложение.

Недостатки:

  • нужно регистрироваться или входить в аккаунт Google;
  • при каждом запросе генерируется четыре варианта, которые списываются из месячного лимита;
  • изображения чаще всего получаются нереалистичными, даже при добавлении photoreal в промпт;
  • пользователи из РФ могут оплатить подписку только картой иностранного банка.

Язык промпта: английский.

Стоимость: бесплатно 16 иллюстраций в месяц, платная подписка на 1 000 генераций — $8 в месяц.

Starryai

В Starryai можно создавать арты на ПК и в мобильном приложении, для этого нужно зарегистрироваться или войти в аккаунт Google. Сервис даёт пять кредитов, которые обновляются каждый день. Для генерирования изображения достаточно составить текстовый запрос и выбрать любой художественный стиль.

По нашим промптам нейросеть сгенерировала несколько вариантов. На первой картинке в стиле Photography — Малефисента и Одри Хепбёрн прогуливаются по Санкт-Петербургу. На второй — женщина, похожая на Джулианну Мур, стиль Cinematic.

Второй вариант не совсем соответствует промпту: женщина изображена в деревенском доме, а не на фоне деревни в тумане, как задумывалось. Если нужен конкретный фон, лучше это уточнять.

10 самых популярных нейросетей для создания картинок

Для Starryai мы использовали следующие промпты:

1. Maleficent and Audrey Hepbern walk in St. Petersburg.

2. A woman, like Julianne Moore, a village with wooden houses, in the fog late at night

Иллюстрации получаются чёткими, насыщенными, приближенными к реальной фотографии. Но важно грамотно прописать промпт, чтобы все требования были учтены.

Преимущества:

  • не требуется VPN;
  • есть медиатека с промптами;
  • можно загрузить любое фото и изменить его с помощью нейросети;
  • реалистичные изображения получаются в режиме Photography;
  • без водяного знака;
  • можно использовать на ПК и на мобильных устройствах, есть приложение.

Недостатки:

  • не предназначен для редактирования изображений;
  • стандартное разрешение 512×576, можно улучшить, но придётся тратить кредиты или покупать подписку;
  • только пять генераций в бесплатной версии, но за один раз можно сделать четыре арта по одному промпту;
  • пользователи из РФ могут столкнуться с проблемой по оплате подписки, для этого нужна карта иностранного банка.

Язык промпта: английский.

Стоимость: пять бесплатных генераций в день, платная подписка от $8.99 в месяц.

Kandinsky 2.2

Kandinsky 2.2 — усовершенствованная версия нейросети от Сбера. Сервис предлагает несколько инструментов ИИ: генерация по тексту, дорисовка загруженных изображений. В этой нейросети можно ввести запрос на русском языке.

Чтобы посмотреть, насколько реалистичными получаются результаты в Kandinsky 2.2, используем уже известные запросы с Джулианной Мур, Одри Хепбёрн и Малефисентой. Стиль — портретное фото.

Изображения получились довольно реалистичными для бесплатной нейросети. Но на картинке с танцующей Одри Хепбёрн есть проблемы с прорисовкой рук. В Kandinsky 2.2 нет лимита на генерацию, поэтому можно постараться добиться нужного варианта.

10 самых популярных нейросетей для создания картинок

Для Kandinsky 2.2 мы использовали следующие промпты

1. «Женщина, 25 лет, похожая на Джулианну Мур, на фоне деревни с деревянными домами, туман, поздний вечер».

2. «Одри Хепбёрн танцует на закате в Санкт-Петербурге».

3. «Малефисента в розовом платье гуляет по японскому саду»

Изображения в других стилях получаются лучше, чем в реализме, особенно впечатляет «Цифровая живопись». По этим же запросам получились вот такие результаты.

10 самых популярных нейросетей для создания картинок

Преимущества:

  • регистрация не требуется;
  • легко разобраться с сервисом;
  • быстрая генерация — около 15 секунд;
  • много настроек для выбора стиля;
  • есть медиатека с изображениями и промптами;
  • можно загрузить любое фото и дорисовать его с помощью нейросети;
  • картинки с разрешением 1024×1024;
  • результат можно сохранить без водяного знака.

Недостатки:

  • не всегда объекты получаются анатомически правильными;
  • не предназначен для полноценного редактирования изображений;
  • нет отдельного приложения для мобильных устройств, но можно использовать бота в Telegram или приложение «Салют».

Язык промпта: русский, английский.

Стоимость: бесплатно.

Bing Image Creator

В марте 2023 года компания Microsoft выпустила бесплатный генератор фото Bing Image Creator. Пользователи из РФ могут использовать его только через VPN — это существенный недостаток, но вполне исправимый. Работать с нейросетью можно в браузере или на сайте, для этого нужно войти в аккаунт Microsoft.

Нейросеть отлично делает арты, которые можно использовать для иллюстрирования статей или постов в социальных сетях. Нужно составить текст для желаемого результата и нажать кнопку. В текстовом запросе важно прописывать желаемый стиль.

Эта нейросеть хорошо создаёт абстрактные арты и фантазийных персонажей, а люди получаются не всегда. Если присмотреться к сгенерированному результату, то можно увидеть анатомические проблемы: несколько пальцев, что-то странное со ступнёй.

10 самых популярных нейросетей для создания картинок

Всё-таки с точки зрения следования промпту и композиции получился интересный арт для иллюстрирования статей. Создателям контента стоит обратить внимание на Bing Image Creator.

Преимущества:

  • простой принцип работы, нужно ввести текст и нажать кнопку;
  • неограниченное количество запросов;
  • быстро генерирует — достаточно 10 секунд;
  • разрешение иллюстраций 1024×1024;
  • нет водяного знака;
  • можно создавать картинки на мобильном устройстве в приложении Bing.

Недостатки:

  • нужно регистрироваться;
  • требуется VPN для пользователей из РФ;
  • нет выбора стилей, нужно прописывать в запросе;
  • не всегда меняет соотношение сторон по промпту, в нашем примере не заменил 1:1 на 3:4;
  • в медиатеке мало примеров;
  • результат получается чаще нереалистичным, проблема с анатомией;
  • нет возможностей для редактирования.

Язык промпта: основной английский, но русский тоже понимает.

Стоимость: бесплатно.

Dream by Wombo

Нейросеть Dream by Wombo можно использовать бесплатно. Для создания изображений нужно зарегистрироваться или войти в аккаунт Google. Интерфейс не вызывает сложностей, нужно ввести текстовый запрос на английском языке, выбрать один из 57 бесплатных стилей и нажать кнопку.

В Dream by Wombo нет ограничений для генерации картинок, но по одному запросу создаётся только один вариант. В протестированном стиле Deamland v3 получили разные варианты: Одри Хепбёрн довольно реалистичная, Малефисента и Джулианна Мур — в виде иллюстраций.

10 самых популярных нейросетей для создания картинок

Для Dream by Wombo мы использовали следующие промпты:

1. Audrey Hepburn dances at sunset.

2. Maleficent in a pink dress walks through a Japanese garden.

3. A woman, like Julianne Moore, a village with wooden houses, in the fog late at night

Dream by Wombo подойдёт дизайнерам, маркетологам, SMM-специалистам, которые планируют создавать несложные арты. Возможностей для этого достаточно.

Преимущества:

  • не требуется VPN;
  • удобный интерфейс;
  • большой выбор стилей;
  • есть медиатека с промптами;
  • быстро создаёт иллюстрации — достаточно 10 секунд;
  • можно загрузить любое фото и сгенерировать похожую картинку в любом стиле;
  • высокая реалистичность, если выбирать соответствующий стиль;
  • хорошее разрешение картинок — 960×1568;
  • доступно редактирование с помощью текстового запроса;
  • сохранение без водяного знака;
  • есть мобильное приложение.

Недостатки:

  • нужно регистрироваться;
  • пользователи из РФ могут оплатить подписку только картой иностранного банка.

Язык промпта: английский.

Стоимость: бесплатно генерирует один вариант по промпту, премиум-подписка — от $9.99 в месяц.

Easy-Peasy.AI

Сначала нейросеть Easy-Peasy.ai генерировала только тексты, но теперь умеет отлично рисовать картинки по заданному тексту. Для этого нужно перейти во вкладку AI Image, ввести промпт, выбрать стиль и дождаться результата.

Портреты получаются реалистичными, насыщенными, детализированными. Но иногда возникают проблемы с анатомией и неверной интерпретацией промпта. По запросу Wednesday Adams eats pizza нейросеть сгенерировала пирог вместо пиццы.

10 самых популярных нейросетей для создания картинок

Преимущества:

  • для доступа не требуется VPN;
  • большой выбор стилей;
  • быстро генерирует — около 20 секунд;
  • разрешение — от 1024×1024, можно увеличить до 4K по платной подписке;
  • высокая реалистичность и детализация;
  • нет водяного знака.

Недостатки:

  • не получится использовать без регистрации;
  • сайт может показаться не совсем удобным, нужно найти вкладку AI Image;
  • мало примеров в медиатеке с промптами;
  • нет мобильного приложения;
  • сложность оплаты для пользователей из РФ, нужна карта иностранного банка.

Язык промпта: английский.

Стоимость: пять генераций бесплатно, платная подписка — от $4.99 в месяц.

10 самых популярных нейросетей для создания картинокКурс

Deep
Learning

Узнать больше

  • Научитесь генерировать тексты и изображения, реализовывать NLP с нуля, строить языковые модели и не только
  • Отработаете навыки на практике: добавите 8 проектов в портфолио
  • Будете учиться при поддержке сообщества экспертов и менторов

Artbreeder

Artbreeder предлагает несколько инструментов для генерирования: объединение картинок, дорисовка изображений, создание артов по текстовому запросу и фото. Кроме того, можно использовать ползунок, чтобы показать нейросети, насколько новое изображение должно быть похоже на предыдущее или соответствовать промпту.

Чтобы начать работу в сервисе, необходимо зарегистрироваться или войти в аккаунт Google, выбрать инструмент, ввести текст, загрузить фотографию и нажать кнопку.

10 самых популярных нейросетей для создания картинок

Artbreeder подойдёт пользователям, которые хотят сделать необычный арт из своих фотографий. Но для профессиональных дизайнеров возможностей нейросети может быть недостаточно, потому что изображения получаются не очень чёткими и реалистичными, фон сильно размыт.

Преимущества:

  • для работы не нужно включать VPN;
  • есть медиатека с артами, на основе которых можно делать новые варианты;
  • быстро генерирует иллюстрации;
  • можно загрузить любое фото и изменить его с помощью нейросети;
  • хорошее разрешение картинок — 1024×1024;
  • можно сохранить результат генерации без водяного знака.

Недостатки:

  • сайт не очень удобный, долго открываются вкладки;
  • в медиатеке нельзя посмотреть и скопировать промпты;
  • фон чаще всего получается размытым;
  • результаты не очень реалистичны;
  • не умеет редактировать изображения по промпту;
  • нет мобильного приложения;
  • не все пользователи из РФ смогут купить подписку, нужна карта иностранного банка.

Язык промпта: английский.

Стоимость: бесплатно 10 кредитов в месяц, покупка 100 кредитов — $8.99 в месяц.

Шедеврум

Шедеврум — нейросеть от Яндекса, генерирующая изображения по тексту и фото. Работает только в мобильном приложении, но на сайте можно посмотреть сгенерированные арты с промптами других пользователей.

Шедеврум подходит для создания картинок, связанных с российскими реалиями, потому что понимает, кто такая Баба-яга. Иллюстрации получаются яркими, детализированными, но на создание одного результата уходит много времени — две-три минуты.

Ещё один минус в том, что созданные иллюстрации можно сохранить только после публикации в общей ленте, но потом их можно удалить.

10 самых популярных нейросетей для создания картинок

Для Шедеврума мы использовали следующие промпты:

1. «Вологда в 2054 году».

2. «Баба-яга в молодости, кинематографично»

Преимущества:

  • удобное мобильное приложение для создания картинок;
  • большой выбор стилей;
  • есть медиатека с промптами;
  • разрешение картинок — 1024×1024;
  • нет водяного знака.

Недостатки:

  • нужно зарегистрироваться или войти в аккаунт в Яндексе;
  • работать можно только в мобильном приложении;
  • изображения генерируются долго — 2–3 минуты;
  • для сохранения картинки нужно её опубликовать;
  • не создаёт иллюстрации со знаменитостями;
  • нет возможности для редактирования готовых артов.

Язык промпта: русский.

Стоимость: бесплатно.

Craiyon

Заниматься творчеством в Craiyon очень просто: необходимо зарегистрироваться или войти в аккаунт Google, сформулировать текстовый запрос на английском, выбрать один из стилей (арт, рисунок, фото) и нажать кнопку.

В Craiyon нет лимита на количество генерируемых изображений. Нейросеть создаёт девять вариантов по одному запросу, но не всегда следует промпту. По промпту «женщина в деревне, похожая на Джулианну Мур, в стиле Skyrim» нейросеть сгенерировала три иллюстрации вообще без героини.

10 самых популярных нейросетей для создания картинок

Craiyon генерирует не очень реалистичные картинки, даже если добавить в промпт Photoreal. Нейросеть подойдёт для несложных артов, которые не требуют детализации и реалистичности.

Преимущества:

  • работает без VPN;
  • нет ограничений по созданию картинок даже в бесплатной версии.

Недостатки:

  • нужно регистрироваться или входить в аккаунт Google;
  • картинки получаются чаще всего нереалистичными;
  • долго генерирует в бесплатном аккаунте, около минуты;
  • есть проблемы с анатомией;
  • разрешение по умолчанию — 256×256, можно улучшить до 1024×1024, если нажать на кнопку Upscale, но придётся ждать ещё минуту;
  • сохраняется водяной знак при скачивании в бесплатной подписке;
  • нет медиатеки, где можно скопировать промпт;
  • готовый арт нельзя редактировать;
  • нет мобильного приложения.

Язык промпта: английский.

Стоимость: бесплатная нейросеть для создания картинок, но можно подключить платную подписку от $6 в месяц, тогда сервис будет быстрее создавать изображения и не устанавливать водяные знаки.

Fotor

Fotor — это фоторедактор, но в него встроены и инструменты для работы с нейросетью. Можно создавать аватары в разных стилях из нескольких фотографий, генерировать изображения по текстовому запросу.

В редакторе нужно зарегистрироваться или войти в свой аккаунт Google и перейти во вкладку AI Tools. В бесплатной версии можно сделать только пять изображений.

Для тестирования выбрали простые промпты: «Малефисента гуляет в японском саду в розовом платье» и «танцующая на закате Одри Хепбёрн».

Результат оказался не очень симпатичным: у Малефисенты проблемы с лицом, у Одри раздвоенная ладонь и что-то с коленом.

10 самых популярных нейросетей для создания картинок

Для Fotor мы использовали следующие промпты:

1. Maleficent in a pink dress walks in a Japanese park.

2. Audrey Hepburn dancing at sunset

Видимо, Fotor больше подходит для абстрактных артов, без изображения людей. Даже бесплатная нейросеть Craiyon выдаёт более интересные результаты.

Преимущества:

  • не нужно включать VPN;
  • быстро генерирует изображения — около 15 секунд;
  • есть медиатека с картинками, можно скопировать промпт;
  • большой выбор стилей;
  • создаёт иллюстрации в хорошем разрешении: 1536×1536;
  • готовый арт можно редактировать: добавлять другие объекты, разные эффекты и фильтры, поменять фон, улучшить качество;
  • пользователи из РФ могут оплатить подписку со счёта QIWI.

Недостатки:

  • нужно регистрироваться для работы в редакторе;
  • неудобный интерфейс, не сразу понятно, что нужно нажать для создания картинки;
  • анатомические проблемы на иллюстрациях, где есть люди;
  • нереалистичные результаты, даже если выбран стиль Photography.

Язык промпта: английский.

Стоимость: бесплатно пять картинок, подписка на 100 генераций — 690 рублей в месяц.

Резюмируем

Алгоритмы работают по одному принципу, но выдают разные результаты. Поэтому при выборе сервиса следует исходить из тех задач, которые необходимо ему поставить.

Для профессионального использования лучше подходят Lexica, Starryai, Easy-Peasy.AI, потому что умеют создавать детализированные и сложные арты с разрешением до 4–8К. Начинающие дизайнеры и SMM-специалисты могут попробовать бесплатные сервисы — Bing Image Creator, Dream by Wombo, Artbreeder, Kandinsky 2.2, Шедеврум, в которых получаются красивые арты в разрешении, достаточном для публикации в социальных сетях.

Важно учитывать, что пользователи из РФ могут столкнуться с проблемой при оплате сервисов, потому что требуется карта иностранного банка. Выходом может быть совмещение в работе профессиональных инструментов с ограниченной подпиской и полностью бесплатных нейросетей.

Читать также

10 самых популярных нейросетей для создания картинокChatGPT и другие сервисы с нейросетями: смотрим, пробуем и читаем

10 самых популярных нейросетей для создания картинокМаркетологам, аналитикам и программистам — какие нейросети использовать в работе

Мнение автора и редакции может не совпадать. Хотите написать колонку для Нетологии? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

Нейросеть дня: посмотрите, как бы выглядели люди с картин в реальной жизни

Стартап Neural Love запустил алгоритм β Portraits HD, который генерирует реалистичные портреты людей на основе старых фотографий, картин или скульптур. О создании сервиса рассказал в телеграме основатель Neural Love Денис Ширяев.

Работает сайт просто: нужно лишь зарегистрироваться, загрузить изображение и подождать. Когда портрет будет готов, сайт пришлет уведомление вам на почту. Время ожидания зависит от количества запросов на сайте — например, на момент написания новости их 666. «Ножу» портреты сгенерировали примерно за час.

Чтобы портрет получился удачным, подберите подходящую картинку: человек на ней должен быть без шляпы, усов и с простой прической. Впрочем, и при соблюдении этих условий компания не гарантирует исторической точности.

Для каждой картинки сервис генерирует два портрета: «реалистичный» и «художественный». Вот что получилось у нас:

Фотореализм в Midjourney: как генерировать в нейросети снимки людей, неотличимые от настоящих

В марте в соцсетях вирусились ИИ-картинки , которые сложно отличить от фотографий.

2022 год стал годом нейросетей, рисовавших арты не хуже человека. В 2023 году пришло время фотографий: фотореализм в Midjourney v5 вышел на абсолютно новый уровень. Если раньше нейросетевые фото можно было отличить по косым глазам или восьми пальцам на руке, то теперь ситуация иная.

Папа Римский в пуховике «Баленсиага», свидание Илона Маска с американским политиком Александрой Окасио-Кортес, никогда не происходившее разрушительное землетрясение в Канаде 2002 года — многие пользователи решили, что это реальность. Midjourney из-за этого уже вводит ограничения и блокирует некоторые запросы. Но фотореализм в нейросетях, видимо, с нами надолго.

Рассказываем, как сгенерировать «настоящие» фотографии и снимки знаменитостей.

31 марта Midjourney приостановила доступ к генератору изображений для бесплатных пользователей. Среди причин в компании назвали «абьюз пробного периода». Создатели нейросети пообещали улучшить систему модерации в скором времени.

Почему у Midjourney v5 получается реализм

До пятой версии Midjourney тренировала свою нейросеть преимущественно для рисования иллюстраций — из стандартных запросов получались арты. Но люди все равно находили способы подражать фотографиям.

В v5 больше всего усовершенствовали именно аспект фотореализма — теперь можно добиться снимков, похожих на реальные. Пока v5 находится в альфа-тестировании , но уже выдает впечатляющие результаты.

Фотореализм по умолчанию. Раньше сгенерировать фотографию в Midjourney было непросто. По запросу вроде «Девушка на улице» нейросеть рисовала арт, а для превращения в снимок приходилось задавать множество дополнительных параметров: тип камеры, жанр съемки, имя знаменитого фотографа.

В v5 Midjourney сразу генерирует фотографии с идеальным освещением, драматичными позами и насыщенными цветами. Так обычно выглядят заретушированные фотографии знаменитостей и моделей.

Картинки более высокого качества. По сравнению с четвертой версией в v5 разрешение увеличили в два раза. Благодаря этому картинки стали выглядеть качественнее.

Улучшенная детализация. Так, v5 почти не страдает от старых проблем ИИ: пальцев на руках теперь пять, глаза смотрят в одну сторону, а во рту — стандартное количество зубов. Благодаря дополнительным деталям генерация лиц заметно улучшилась.

Большое количество людей. Раньше нейросеть не справлялась с несколькими людьми на одном изображении. Сейчас артефакты все еще видны, но уже на втором-третьем плане.

Как генерировать реалистичных людей

Чтобы понять, как пользоваться Midjourney и как составлять простые запросы, читайте наш гайд. В этом тексте я разберу частный случай: как писать промпты для генерации реалистичных картинок в пятой версии нейросети. Чтобы достичь таких же результатов, обязательно включите v5 — через команду —v5 к промпту или в настройках.

Составляйте запросы на английском языке

Нейросети обучались на парах «картинка-описание» на английском, поэтому лучше всего воспринимают запросы на «родном» языке. Они понимают другие языки и даже эмодзи, но результаты будут непредсказуемы. Если не знаете английский, пользуйтесь нейросетевым переводчиком DeepL — он учитывает контекст лучше, чем Google Translate.

Чем детальнее будет ваш запрос, тем лучше будут и результаты. Поэтому запросы для генерации фотографии выглядят достаточно длинными.

Каждое слово в запросе указано не просто так, оно задает разные параметры. Мой запрос построен по такой структуре: стиль — герой — камера — освещение — построение кадра — атмосфера — локация — дополнительные детали — соотношение сторон. Разберем каждый параметр.

Обложка статьи

Разбираем запрос

Street style photo (стиль) of a young blond woman (объект) in Balenciaga (деталь одежды) walking (действие), shot on Kodak Gold 200 (пленка), natural lighting (освещение), medium shot (план), New York (локация), fine grain (дополнительная деталь), —ar 4:3 (соотношение сторон)

Стиль. По умолчанию Midjourney генерирует фотореализм. Но если ваш запрос слишком далек от реальности, например это мистические существа, то нейросеть уйдет в иллюстративный стиль или концепт-арт .

Чтобы нейросеть наверняка сгенерировала фотореализм, добавляйте в начало photo. Однако этот запрос дает скучные результаты: обычно это портретные снимки на черном фоне. Чтобы сделать результат интереснее, выберите стиль фотографии, например street style photo, editorial photo, fashion photo, portrait photo — уличные фото, фото для журналов, фэшн-фотография , портреты.

Обложка статьи

Если хочется сделать историческое фото, то выбирайте эпоху. Например, 1960s street style photo. Это повлияет как на атмосферу снимка, так и на одежду модели. Без этого указания Midjourney сгенерирует современную фотографию.

Герой. Это основа любого запроса. Если написать в промпте «мужчина» или «женщина» без дополнительных деталей, то нейросеть генерирует случайного человека. Это удобно, если у вас нет конкретного образа в голове и вы просто перебираете идеи.

А если указать черты лица, цвет волос, этничность, одежду и аксессуары, то Midjourney постарается передать все указанные вами детали. Образ модели можно прописывать вплоть до цвета глаз и мимики. Если отдельная деталь особенно важна, то добавляйте к ней восклицательные знаки или слова intricate и detailed.

Например, детальное описание героя снимка выглядит: gorgeous 30-year-old woman with long brown hair, green eyes. detailed cheekbones, a sly grin. Буквально это переводится как « 30-летняя красивая женщина с длинными темными волосами, зелеными глазами, выраженными скулами и лукавой ухмылкой».

Также в пятой версии Midjourney «знает» многие известные бренды, например «Гуччи», «Баленсиага» или «Найк», и точно попадает в эстетику. Можно выбрать цвет предмета одежды и даже ткань: хлопок, лен, кожа будут отличаться друг от друга.

Обложка статьи

Детальное описание одежды выглядит так: woman wearing a stunning white lace Gucci gown with a full tulle skirt, intricate lace detailing, long lace sleeves, a high collar, and a fitted bodice adorned with delicate floral appliques. Буквально: «женщина в потрясающем белом кружевном платье „Гуччи“ с юбкой из тюля, сложным кружевом, длинными кружевными рукавами, высоким воротником и приталенным лифом, украшенным нежными цветочными аппликациями».

Камера. От нее зависит цветокоррекция и атмосфера снимка. Добавляйте к запросу shot on, а затем название камеры или пленки. Цифровые камеры дают резкую контрастность, а пленочные — теплоту и мягкость. Вот какие цифровые камеры можно попробовать:

  1. Hasselblad X1D. Стандартная камера, с которой генерируются хорошие снимки. Альтернативы, чтобы получить немного другие результаты: Canon EOS R6 Mark II Mirrorless, FUJIFILM X-T5 Mirrorless, Canon PowerShot G7 X Mark II, Control.
  2. GoPro или GoPro Video. Добавляет эффект рыбьего глаза к селфи, подходит для снимков с активным действием.
  3. Insta360 Pro. Экшен-камера с углом обзора 360°.

Для пленочных фотографий указывайте не камеру, а название пленки. Вот что можно попробовать:

  1. Fujifilm Pro 400H. Высокочувствительная пленка, подходящая для дневного освещения. Для свадебных, рекламных и модельных снимков.
  2. Agfa Vista Plus 200. Хорошо воспроизводит естественный тон кожи и работает в разном освещении. Подходит для портретной съемки.
  3. Tri-X 400 . Черно-белая пленка, подходящая для сложных условий освещения.
  4. Kodak vision3 500. Подходит для естественного и солнечного освещения, особенно для золотого часа.
  5. Kodak Gold 200. Пленка с яркой насыщенностью, мелким зерном и высокой резкостью картинки. Для естественного освещения.
  6. Kodak Portra. Подходит для снимков на природе или с легким туманом.
  7. Kodak Ektar. Дает ретрооттенки и контраст.

Более интересные варианты на «низкокачественные» камеры, подходящие для вечеринок:

  1. Lomo. Перенасыщенные снимки с высоким контрастом и мягким размытием.
  2. Disposable Camera. Фиксированный фокус и мягкий свет.
  3. Polaroid. Блеклые фото с высокой точкой черного.
  4. Instax. Дневные снимки с яркой насыщенностью и фильтром как будто из соцсети начала 2010-х .

Освещение задает тон и общую атмосферу снимка. Указывайте погодные условия: sunny, cloudy, rainy, snowy, foggy, hazey — солнечно, облачно, дождливо, снежно, туманно, дымчато.

Время суток тоже влияет на освещение: sunrise, morning, afternoon, golden hour, sunset, twilight, evening night — рассвет, утро, полдень, золотой час, закат, сумерки, ночь.

Midjourney также понимает тип освещения и его источник. Например:

  1. Studio Lighting. Студийное освещение с искусственными источниками света на фоне используется для портретов и коммерческой фотографии.
  2. Natural Lighting. Естественное дневное освещение.
  3. Off-Camera Flash. Имитирует портативную вспышку. Получаются ночные снимки с освещенным лицом.
  4. Spot Lighting. Освещение, при котором используется сфокусированный луч света, освещающий определенную область.
  5. Backlight with Hair Light. Освещение «сквозь волосы».
  6. Split Lighting with Rim Light. Боковое освещение с «подсветкой» волос.
  7. Silhouette Lighting with Side Light. Источник света располагается позади объекта съемки, резко выделяя его контуры на общем фоне.

Чтобы получить интересную композицию, комбинируйте разное время суток, погодные условия и боковое освещение, например солнечный день или туманный вечер с неоном.

Красивую картинку можно получить методом проб и ошибок: некоторые промпты будут не получаться, а цвет освещения может «задевать» одежду.

Позиция камеры. Этот параметр влияет на угол съемки и положение объекта в кадре. Вот какие варианты можно попробовать:

  1. Wide-Angle Shot. Камера удалена от объекта. Чтобы «отойти» от объекта еще дальше, добавляйте Ultra-Wide Angle или Ultra Wide-Angle . При выборе такого кадра стоит описывать, что происходит на фоне: он все равно будет размыт, но эстетика снимка от этого поменяется.
  2. Medium Shot. Снимок по пояс. Укажите, что делает модель, например «сидит», «идет» или «смотрит в телефон», иначе она будет просто смотреть в камеру. Есть вариации среднего кадра: снизу — Low-Angle Shot и кадр — High-Angle Shot.
  3. Close-Up Shot. Крупный план. Попробуйте добавить эмоцию, например «радостный», «удивленный», «печальный». Описательные слова, например «обрадованный», overjoyed, дадут лучшие результаты, чем обычное «счастливый», happy.
  4. Full-Body Shot. Модель в полный рост. Нейросеть часто обрезает ноги и коленки, но добиться желаемого результата можно.

Локация. Указывайте, где находится герой: в городе, на пляже, в квартире, в кафе. Midjourney «знает», как выглядят известные города: на фон можно добавлять Лондон, Нью-Йорк , Токио или Москву. Нейросеть передает атмосферу, характерные элементы городов и известные здания, но копию с реальности не выдаст.

В зависимости от локации придумайте, что делает человек: пьет кофе, ест, просто сидит и смотрит в окно. Если не указывать действие, то он будет делать то, что обычно люди делают в такой локации. Например, если это пляж, то идти, если кафе, то сидеть за столиком.

Другой способ добавлять локацию — генерировать персонажа отдельно от фона, а затем совмещать две картинки в одной.

Для этого добавьте в начале запроса две ссылки на сгенерированные изображения, а затем пропишите обычный запрос. Например, a young blonde woman sitting in american diner, medium shot, blue and pink colors — «молодая блондинка сидит в американской закусочной, средний план, голубые и розовые цвета».

Соотношение сторон. В конце запроса указывайте команду —ar . По умолчанию картинки генерируются в соотношении 1:1 , но это можно поменять. Например, на 4:3 для горизонтальных, 3:4 для вертикальных или 16:9 для кинематографических снимков.

Как получить консистентную модель. Если вам понравился сгенерированный человек, то его можно «скопировать» в другие генерации. Для этого вам нужно узнать сид изображения — это точка отсчета из шума, откуда Midjourney начинает генерацию. Они случайно присваиваются каждому изображению.

Чтобы узнать сид уже сгенерированной картинки, отреагируйте на пост с результатом от бота эмодзи в виде письма. Его можно легко найти в поиске по запросу:envelope:. Бот пришлет в личные сообщения оригиналы картинок и значение сида. Сид можно также указать самостоятельно при генерации, добавляя в конце —seed x , где x — любое число.

Обложка статьи

Если вы будете использовать один и тот же промпт с одинаковым сидом, то получите одинаковые картинки. Если немного изменять запрос, то картинка будет меняться, а модель оставаться примерно такой же .

Для этого добавьте в запрос ссылку на картинку, скопируйте запрос, по которому она сгенерировалась, и поменяйте какую-нибудь деталь. Например, я сгенерировала девушку в зимней одежде, а затем изменила время года на лето: одежду я отдельно не прописывала, но нейросеть автоматически поменяла шапку на летнюю шляпку.

Стиль фотографа. Есть лайфхак, если вам не хочется продумывать и прописывать детали вроде освещения, атмосферы, положения камеры и всего остального.

Просто укажите после описания объекта имя известного фотографа, и нейросеть сымитирует его стиль. Их можно подсмотреть в библиотеке промптов для Midjourney.

Как генерировать знаменитостей

Укажите имена знаменитостей. Вместо объекта пропишите в запросе имя и фамилию человека: нейросеть знает, как выглядит Илон Маск, Леонардо ДиКаприо, Пэрис Хилтон, Билл Клинтон и другие известные личности. Российские знаменитости вряд ли получаются — только если их фото широко представлены в англоязычном пространстве рунета.

Если вы генерируете популярного героя из фильма или сериала, то указывайте имя персонажа, а не актера, чтобы точнее попасть в образ. Например, Уолтер Уайт в запросе сработает лучше, чем Билл Крэнстон. При этом книжных персонажей нейросеть создает скорее по фан-арту , чем по образу актеров из экранизации.

Придумайте сцену. Поместите знаменитость в необычный для него сеттинг или придумайте абсурдный образ. Одежда, аксессуары и мимика генерируется точно так же , как и у несуществующих в реальности людей.

Обложка статьи

Напишите запрос. Все наши советы можно применить к генерации знаменитостей. Добавьте освещение, выберите камеру и укажите ее положение, чтобы добиться большего реализма.

Откуда взялось столько фейков из Midjourney

В конце марта завирусился первый массовый мем, сгенерированный в Midjourney. Пользователь «Реддита» опубликовал картинки с Папой Римским в огромном дутом пуховике «Баленсиага». За выходные они распространились в соцсетях, а многие пользователи приняли их за реальные фотографии.

Другие пользователи стали генерировать Франциска в том же стиле и запустили флешмоб, чтобы еще больше запутать интернет. В итоге журналистам пришлось выпускать опровержения и переубеждать людей: нет, Папа Римский не ходит в белых пуховиках.

Обложка статьи

Последний фейк даже вызывал реакцию у Midjourney — компания забанила слово «тюрьма» и «арест». Теперь запросы с этими словами нейросеть больше не генерирует. Обойти ограничение несложно: для этого нужно переформулировать промпт и написать «Дональд Трамп в наручниках в окружении полиции».

Превентивно Midjourney забанила генерацию изображений китайского президента Си Цзиньпина. CEO компании прокомментировал это решение так: «Политическая сатира в Китае неприемлема. Возможность людей в Китае использовать эту технологию важнее, чем ваша возможность генерировать сатиру». Таким образом в компании намекнули на то, что Midjourney могли бы заблокировать в стране, если бы такие картинки завирусились.

Пока все еще можно понять, что перед вами сгенерированное в Midjourney изображение. При внимательном рассмотрении часто видны артефакты и смазанные предметы. Сами фотографии получаются слишком идеальными: как будто бы сделанными на профессиональную камеру и сильно заретушированными в «Фотошопе».

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *