Нейросеть Midjourney

Нейросеть Midjourney


Использование нейросетей на сегодня – достаточно распространенное явление. С их помощью удается генерировать различные картинки, изображения разными способами. И Миджорни – одна из таким нейросетей на основе искусственного интеллекта.

Что такое Midjourney

Midjourney является нейросетью последнего поколения. Она способна создавать различные изображения по написанному для нее тексту. Благодаря искусственному интеллекту процесс рисования требует всего пары кликов и несколько секунд на генерацию картинок.

Также нейросеть способна улучшить изображения, которые предоставляет пользователь, менять их стиль, адаптировать и перерисовывать. Все, что нужно – описать примерные ожидания, то какой желает увидеть работу пользователь. Нейросеть сразу предлагает самые интересные вариации картинок.

Midjourney является продуктом, основанным на искуственном интеллекте. Разработан он исследовательской студией с одноименным названием. Эта нейросетевая модель обладает способностью создавать удивительные изображения, применяя передовые методы, основанные на генеративно-состязательных сетях.

Как работает Midjourney

Нейросеть Midjourney создает картинки или изображения, основываясь на текстовом описании. В систему вводится необходимый фрагмент текста, где указываются ожидания к результату. После этого нейросеть создает на его основе картинки. Эта платформа является лучшим решением для создания реалистичных изображений.

Стоит понимать, что данная нейросеть относится к типу Al, а потому может не понять отдельные запросы. Кроме того, все фразы нужно отправлять на обработку на английском языке. После запроса /imagine prompt: вводится текст, который состоит из трех частей:

  • a – то, что нужно сгенерировать с учетом параметров и свойств;

  • b – указание стиля изображения;

  • c – данные о рендеринге, размере и иных параметрах картинки

После введения всех данных система выдает наиболее подходящие под запрос результаты.

Модели и версии миджорни

Существует несколько моделей Миджорни. Выбрать нужную можно либо через настройки, либо указывая нужный параметр в конце запроса, например, -- v 1 либо -- niji. Основные модели:

  • v1. Указывается в параметрах как --v 1 или --version 1. Данная модель считалась основной около 2 месяцев в феврале-апреле 2022 года. Создает не особо внятные и очень абстрактные изображения.

  • v2. Указывается в параметрах как --v 2 или --version 2. Эту версию сделали основной на целых четыре месяца – в апреле-июле 2022 года. Разработчики сказали, что это цветастая, креативная и живописная модель. Соответственно изображения соответствуют запросам лучше, чем в v1.

  • v3. Указывается в параметрах как --v 3 или --version 3. Считалась основной версией в июле-ноябре 2022 года. Именно эту модель выпустили для публичного тестирования. Она же и получила первых подписчиков на платной основе и сделала компанию Миджорни известной. Модель создает неплохие, соответствующие запросу композиции, а также появилась функция сохранения генерации в виде видео.

  • v4. Указывается в параметрах как --v 4 или --version 4. Была выпущена в 2022 году в ноябре. Нейросеть сменила свою архитектуру и расширила базу для обучения. Если предыдущие версии не обладали представлением о внешности различных существ и локаций, то эта умеет создавать детализированные картинки и показывать взаимное воздействие на всех кадрах между объектами. Точно генерирует картинки в соответствии с запросом, а также имеет возможность создавать результаты, основанные на других изображениях.

  • Niji. Указывается в параметрах как --niji. Своеобразный синтез команд Миджорни и Spellbrush. Данная модель создает изображения в стиле аниме и манги. Создает идеальные динамичные изображения, в которых в центре внимания – главный персонаж. По сути это одна из веток версии v4, а потому она может работать с изображениями и фрагментами, отраженными в запросе.

  • Test и Test Photorealistic. Указывается в параметрах как --test или --testp. Эти модели постоянно дорабатывают разработчики Миджорни, а потому и внятного описания системы нет. Но зато с помощью Test можно создавать более художественные изображения, которые будут высоко соответствовать тексту запроса, а вот Test Photorealistic ориентирована на фотографичный результат. Параметр --creative для этих версий поможет генерировать более разнообразные картинки. И все же возможности данных систем довольно урезаны – они не используют картинки как эталон, а также не способны разделять запросы на фрагменты.

  • v5. Указывается в параметрах как --v 5 или --version 5. Появилась эта версия спустя несколько месяцев после Midjourney 4. У этой версии более отзывчивые подсказки и широкий диапазон стилистики, высокое качество картинок и динамического диапазона, изображения более подробные. Производители описали данное творение тремя словами: качество, стилистика, детализация.

  • v6. Midjourney нового поколения переработана с нуля. Пока работает в режиме альфа-тестирования и доступна не всем. Из нового, теперь потребуется более длинно и точно прописывать текст, а Миджорни при генерации будет им следовать. Говорят, что часть функций перестанут работать или станут работать по другому.

Учитывая, что большая часть версий выпускалась спустя 3-4 месяца, вполне вероятно, что и новые вариации программы не за горами.

Стоимость миджорни

Пользователи Дискорда могут воспользоваться возможностью бесплатной генерации изображений в Midjourney. Но у данного предложения существуют ограничения – дается все 25 штук на одного пользователя. Для этого нужно добавить бота и пользоваться им. Когда все только попытки будут использованы, можно создать новый аккаунт или же попросить друзей воспользоваться их бесплатным Миджорни.

Если говорить о платной версии, то подписка может быть нескольких уровней. При этом в каждой вариации даются часы быстрой генерации. По их окончании изображения создаются уже гораздо медленнее. Основные пакеты:

  • Базовый. Стоит 10 долларов или 907 рублей за месяц либо 96 долларов (8704 руб) за год. Быстрые часы – 3,3 в месяц.

  • Стандартный. Стоимость 30 долларов в месяц (2720 руб) или 288 долларов (26113 руб) в год. Быстрые часы – 15 за месяц.

  • Профессиональный. 60 долларов за месяц (что равно 5440 руб) за месяц или 576 долларов (52226 руб) за год. Быстрых часов дают до 30 в месяц.

На любом уровне платной версии можно пользоваться каналом General.

Важно отметить, что российским пользователям оплатить премиум-версию не получится из-за ограничений. Поэтому придется поискать друга, у которого есть иностранная карта.

Что умеет

Эта платформа применяется чаще всего либо обычными людьми, что называется – для баловства, либо графическими дизайнерами. Нейросеть Midjourney обладает своими уникальными функциями, что делает ее особенно удобной:

  • Создает из текста изображения. Текстовое сообщение применяется, чтобы управлять процессом генерации картинок для получения более творческого и реалистичного результата.

  • Изменяет изображения. При загрузке собственных фото или изображений можно попросить Миджорни их изменить. Поменять можно все – цвет, стиль, композицию, либо добавить иные элементы.

Миджорни достаточно просто пользоваться – достаточно ввести короткое (или не очень) сообщение в строку и модель займется генерацией картинки. Простой интерфейс позволяет быстро начать работу в системе.

Интересно, что Midjourney – это не одна, а целых две нейросети. Одна ориентирована на понимание текста, а вторая – на создание картинок.

Ограничения

Нейросеть Миджорни до сих пор не умеет рисовать пальцы на руках и ногах. При этом она также не умеет:

  • Считать до пяти;

  • Часто не может отличить право и лево;

  • Не отличает мизинец от большого пальца;

  • Если на картинке больше двух рук, то получится настоящий монстр;

  • Также нейросеть не всегда может убрать какие-либо предметы с картинки, например, очки;

  • Миджорни делает всех по умолчанию азиатами, а потому расу или национальность также следует указывать;

  • Кроме рук Midjourney не всегда ладит с глазами, а потому нередко рисует людей с очками, таким образом скрывая свои огрехи в редактуре фото;

  • Нейросеть имеет весьма своеобразные представления о возрасте. Начиная с 30 лет она подрисовывает мешки под глазами, а также придает лицу весьма изможденный вид.

Также пользователи отметили, что Midjourney не принимает в качестве описаний слова, касающиеся крови или секса. Видимо, таким образом действует местная цензура.

Можно ли получить доступ из России

В целом доступ из России получить можно, но оплатить своей картой программу не получится из-за ограничений страны. Сейчас платформа в России функционирует на Дискорде с помощью специального бота. Для его использования пользователь должен иметь аккаунт. Для входа в Миджорни нужно:

  1. Зайти на сайт нейросети и нажать на Sign In. Появится окошко, где попросят дать доступ к аккаунту. Нажимается «Авторизоваться». Если процедура выскакивает несколько раз – все разы нажимать на авторизацию.

  2. Внизу страницы Миджорни будет надпись Join the Discord to start creating, на которую нужно нажать.

  3. Как появится табличка с приглашением – нужно его принять.

  4. Осуществляется переход в Web-приложение Дискорда, где уже можно создавать свои новые шедевры.

  5. Слева в окне нужно найти «комнаты» Newcomer Rooms. Они могут называться по-разному, например, newbies-108. Нужно нажать на любую из них и начать творить.

Редко, но для регистрации могут потребовать введения номера телефона. Можно ввести свой личный, либо использовать любой сервис виртуальных смс для активации

Как пользоваться нейросетью

Чтобы воспользоваться Midjourney, нужно следовать следующему алгоритму:

  1. В чате, расположенном внизу страницы бота Дискорда пишется /settings.

  2. В первой строке выбирается версия Миджорни.

  3. Во второй – качество фото – обычно выбирают Base quality.

  4. В третьей – стилистика фото. Следует помнить, что более высокий показатель дает и более креативный результат в итоге. Чаще всего выбирается Style med.

  5. Четвертая строка отвечает за масштаб фото, для чего выбирается Regular upsacle.

  6. В пятой строке выбираются режимы публикации картинок, для чего выбирают Public Mode. и Fast Mode

  7. Как только настройка завершена в чат пишется /imagine, после чего жмется клавиша Tab, а после этого вписывается test.

  8. После этого бот оповещает о правилах сообщества, с которыми пользователь должен согласиться. На этом настройка завершена.

После настройки можно приступать к созданию картинок. Для этого в чат команды вводится /imagine и после этого пишется описание будущей картинки на английском языке. Отправляете данное сообщение и ожидаете ответа.

Где лучше использовать Midjourney

Изображения, которые создала платформа Миджорни, используются маркетологами, веб-дизайнерами, фотографами, а также во многих других профессиях. Если говорить о бизнесе в целом, то частое применение эта сеть находит в маркетинге, архитектуре, рекламе, дизайне, а также способна создавать анимацию, тем самым заменяя сразу несколько художников. Нашла она свою нишу в производстве и ритейле, а также в театральном искусстве, например, для создания костюмов, грима, декораций.

Примеры запросов (промты)

  • /imagine prompt: Futuristic city with flying cars and skyscrapers, digital illustration, detailed, contrasting colors, --ar 16:9 - для создания заглавной картинки к публикации .

  • /imagine prompt: a raccoon in a Captain America costume, marvel style - Енот - Капитан в стиле Марвел для мультипликации .

  • /imagine prompt: Sigmund Freud as Terminator T-800, a fusion of man and machine. The machine half of his face is made of cold, hard metal, while the other half is still human, with wrinkles and a thick gray beard. Freud stands in front of a desk, surrounded by stacks of books and scientific instruments. His metal hand rests on a pile of papers, while his human hand holds a cigar. The room is dimly lit, with shadows cast by the dim lamp on the desk. A sense of intellectual power and determination permeates the atmosphere. --c 15 --s 750 --q 2 --ar 3:2 - картинка для блога .

  • /imagine prompt: Rich man's house leather sofa chandelir hunting trophies octane render, darkslategray wall, ultra details, interior design, af chalk on teh wall :: --ar 3:2 --no deer - для портфолио дизайнера интерьеров

  • /imagine prompt: A logotype for an animation and arts company, featuring a minimalistic yet playful design that combines a simple icon and the company name. The icon is a stylized representation of a pencil, with curved lines and a bold stroke that gives it a dynamic and lively feel. The company name is written in a modern sans-serif font, with a bright color palette that includes shades of orange, blue, and green. The logo is designed to convey the company's focus on animation and arts, with a clean and modern aesthetic that emphasizes creativity and innovation. --ar 16:9 – для создания логотипов компании.

Отзывы пользователей и бизнеса

В целом пользователи оценили данную нейросеть на 4,5 балла из 5. 0,5 балла отняли за то, что еще есть огрехи в работе, о которых говорилось ранее. Программа отлично зарекомендовала себя для бизнеса, а также для личного пользования.

Стоит понимать, что продавать картинки могут только пользователи платных аккаунтов. Для пользователей бесплатной программы доступно только некоммерческое использование. Также нужно учитывать, что нейросеть может применять сгенерированное вами изображение неограниченное количество раз и для любых целей.

Обсуждение

Кликните на изображение чтобы обновить код, если он неразборчив