В России появились новые нейросети — «Шедеврум» и Kandinsky 2.1. Они генерируют изображения по текстовому описанию. Их интерфейс — на русском языке. Кому могут быть полезны российские разработки, читайте в статье.
Особенности зарубежных нейросетей
Зарубежные нейросети Midjourney, DALL-E и Stable Diffusion стали популярными около года назад. Люди начали использовать искусственный интеллект для развлечения, социальных сетей, рекламы и даже создания фейковых новостей.
Качество работы зарубежных нейросетей впечатляет. Русскоязычной аудитории может быть сложно только из-за того, что искусственные интеллекты работают на английском. Некоторые программы позволяют ставить задачу на русском, но не всегда учитывают лингвистические особенности. И даже если результат оказался подходящим, нелегко разобраться в интерфейсе.
Пользоваться нейросетями можно по-разному. У Stable Diffusion есть веб-версия, Midjourney доступна только через Discord, а с DALL-E работают люди с аккаунтом Google или Microsoft.
Разработчики российских нейросетей стараются учитывать нюансы, чтобы на следующем этапе развития искусственный интеллект выдавал еще более мощные результаты и был прост в использовании.
Генеральный директор информационного агентства TelecomDaily Денис Кусков отметил, что появление российских нейросетей говорит о том, что в технологическом плане страна продолжает свое развитие. А здоровая конкуренция поможет сформировать реальный пользовательский опыт в тестировании нейросети у россиян. Возможно, разработки внесут свой вклад в мировое развитие искусственного интеллекта.
Нейросеть в телефоне
Яндекс выпустил бета-версию первого приложения «Шедеврум» с использованием нейросети, доступного для широкой аудитории в России. Ее особенность в том, что нейросеть встроена в отдельное приложение, а не интегрирована в другие каналы.
Приложение стало доступно для скачивания в App Store и Google Play 5 апреля, и менее чем за сутки оно возглавило топ самых скачиваемых бесплатных приложений в российской версии App Store.
Нейросеть в приложении выполняет разные полезные задачи. Можно создать картинку для себя или сохранить в своей ленте, показать другим пользователям, лайкнуть чужие изображения. Самые популярные посты попадают в раздел «Лучшие». Вкладка «Недавние» показывает, что нагенерировала нейросеть в последние минуты. Пользователи создали уже более 100 тысяч постов.
Разработчики советуют писать запрос как можно более детально, чтобы «Шедеврум» смог сделать более качественное изображение. Приложение показывает четыре варианта. Можно попросить создать картинку в стиле фильмов известного режиссера или направления в искусстве.
По словам руководителя управления машинного интеллекта и исследований «Яндекса» Алексея Гусакова, к финальному релизу «Шедеврум» сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только.
«Шедеврум» безопасен для детей, потому что приложение не обрабатывает запросы, связанные с контентом, доступным только после 18 лет, насилием и жестокостью.
Нейросеть создает иллюстрации по принципу каскадной диффузии. Первый шаг — эскиз изображения по запросу, второй — детализация и высокое разрешение. Генерация занимает в среднем 30 секунд.
Пока протестировать нейросеть могут не все зарегистрированные участники — нужно отправить запрос и дождаться его принятия. Но в финальной версии это ограничение устранят.
«Шедеврум» не перестает учиться. Первую версию обучили на 240 миллионах примеров картинок с текстом, а сейчас это количество увеличилось до 500 миллионов, в том числе с запросами на английском языке.
Виртуальный художник
Другая российская разработка — Kandinsky 2.1, которую презентовали прошлым летом. Искусственный интеллект поддерживает 100 языков. Как и «Шедеврум», нейросеть генерирует картинки по текстовому запросу, но дает только один вариант. Кроме этого, она может смешивать два изображения, менять у уже готовой иллюстрации стиль (есть возможность выбрать его из готового списка) и дорисовать недостающие детали.
Kandinsky 2.1 дает полную свободу в запросах, поэтому детям показывать возможности программы, возможно, не стоит. Пользоваться нейросетью можно на сайте или с помощью навыка «Включи художника» в голосовом помощнике «Салют», генерация изображения займет от одной до трех минут. Телеграм-бот искусственного интеллекта работает медленнее.
Нейросеть доступна только для создания картинок, в отличие от «Шедеврума», который планирует стать новой соцсетью. Директор группы креативного продюсирования «Михайлов и Партнеры» Александр Пугачевский отметил, что большое преимущество нейросети Яндекса как раз в механике дистрибуции контента, которой так не хватало всем нейросетям до этого.
Изображения, которые получились у Kandinsky 2.1, нельзя сохранить на сервере, единственный вариант — скачать их. Показать друзьям можно саму картинку или ссылку на нее.
Светлана Дергачева, генеральный директор Content AI, считает, что разработка российских нейросетей — важный шаг. Так Россия следует за мировыми трендами. Постепенно работа искусственного интеллекта перестанет восприниматься как забава и интегрируется в бизнес-процессы, чтобы повышать продуктивность сотрудников и эффективность компаний.