Содержание
Нейросеть рисует: 5 способов сгенерировать картины онлайн
Сервисы для генерации картинок с помощью искусственного интеллекта набирают популярность: многие видят в них новый источник креатива для дизайна и рекламы. Некоторые приложения бесплатны и доступны всем желающим
Возможности искусственного интеллекта используют не только в серьезных, но и в развлекательных целях. Существует целый ряд сервисов, которые способны сгенерировать картинки по текстовому описанию. РБК Тренды подготовили подборку таких сервисов и протестировали их, попросив нарисовать одно и то же. Запрос выглядел так: «space dolphin earth pink blue metaverse music» («космос дельфин Земля розовый синий метавселенная музыка»).
Содержание:
- DALL-E Mini
- ruDALL-E Kandinsky
- Midjourney
- Starryai
- Dream by WOMBO
DALL-E Mini
Как попробовать:
- зайти на официальный сайт Dall-E Mini через ресурс Hugging Face;
- найти раздел dall-e;
- ввести текстовое описание на английском языке, разделяя слова пробелами;
- нажать Run;
- когда изображение будет сгенерировано, понадобится сделать снимок экрана, чтобы сохранить всю подборку, или сохранить каждую картинку по отдельности.
Нейросеть в начале 2021 года представила компания Илона Маска OpenAI. Разработчики обучили ее создавать изображения из коротких текстовых подписей. Приложение работает на основе другой модели генерации текста от OpenAI — GPT-3. Она обучена на 12 млн параметров и способна создавать антропоморфные версии животных и объектов, объединять в картинке несвязанные концепции, подбирать текст для существующих изображений. Название программы отсылает к художнику-сюрреалисту Сальвадору Дали и персонажу Wall-E из одноименного мультфильма. В 2022 году команда выпустила версию DALL-E 2, которая генерирует реалистичные изображения, но пока она недоступна широкому кругу пользователей и компаний.
ruDALL-E Kandinsky
Как попробовать ruDALL-E Kandinsky:
- зайти на официальный сайт нейросети;
- выбрать «Попробовать»;
- ввести текстовое описание в окне через пробелы на русском языке;
- ввести код подтверждения;
- скачать готовую картинку или поделиться ею в соцсетях через специальную кнопку.
Также можно посмотреть варианты сгенерированных для других пользователей картинок по похожим запросам (по нашему таких не нашлось).
Картинка по описанию ruDALL-E Kandinsky
Нейросеть в 2021 году разработало подразделение SberAI совместно со SberDevices, Самарским университетом, AIRI и SberCloud. Оно работает на базе программного обеспечения DALL-E, но генерирует картинки по описанию на русском языке. В открытом доступе уже есть модели генератора — ruDALL-E Malevich (XL), которая генерирует картинки в стиле Малевича; Sber VQ-GAN, которая генерирует изображения в хорошем разрешении; ruCLIP Small для ранжирования изображений и подписей, а также Super Resolution (Real ESRGAN) для генерации в супервысоком разрешении.
В 2022 году SberAI выпустила большую модель ruDALL-E Kandinsky, обученную на 12 млрд параметров. Она доступна в приложении «Салют» от SberDevices и в боте Discord. По словам разработчиков, генерация изображений учитывает точное описание желаемого и создает уникальные изображения, которые раньше не существовали. Их можно использовать для иллюстраций статей, а также в копирайтинге и рекламе.
Midjourney
Как попробовать:
- зарегистрироваться на платформе для геймеров Discord;
- зайти на официальный сайт Midjourney и авторизоваться через Discord;
- перейти в один из ботов newbie и ввести в поле для отправки сообщения команду /imagine;
- ввести описание на английском языке в плашке Prompt;
- кликнуть «Отправить»;
- появятся четыре картинки, после этого можно воспользоваться кнопкой U, чтобы улучшить разрешение одной из них, или кнопкой V, чтобы создать еще четыре вариации выбранной картинки;
- нажать на понравившуюся картинку и выбрать «Открыть оригинал», а затем сохранить ее, также можно сохранить весь коллаж.
Эту нейросеть разработала одноименная американская компания, которую основал ученый и бывший сотрудник Института Макса Планка Дэвид Хольц. В середине июля 2022-го Midjourney вышла в фазу бета-тестирования и стала доступной для пользователей по всему миру. В бесплатной версии можно сгенерировать 25 сетов в низком разрешении или меньше, так как попытки улучшить изображения засчитываются как новая попытка генерации. По сравнению с конкурентами Midjourney обеспечивает более высокое разрешение итоговых картинок и большую детализацию в соответствии с текстовым запросом.
Starryai
Как попробовать:
- перейти на сайт Starryai, кликнуть «Start Creating»;
- пройти верификацию через Google или Apple;
- выбрать опцию Altair или Orion;
- в окне Prompt ввести текстовое описание на английском языке;
- в окне появится картинка, которая будет преобразовываться прямо на глазах;
- кликнуть на готовое изображение и выбрать Download, также можно поделиться картинкой в соцсетях или даже создать из нее анимацию.
Нейросеть создает картинки на основе текстового описания, но с дополнениями. В режиме Altair можно создать сказочное изображение, которое будет представлять собой более абстрактные художественные рендеры ИИ. В режиме Orion можно создавать более сложные и кинематографичные изображения, смешивая до трех стилей. Для генерации используется система кредитов, которые можно не только купить за деньги, но и заработать — посмотреть рекламу или поделиться работой в соцсетях. Для уже готового изображения доступна опция увеличения разрешения за дополнительные кредиты.
Dream by WOMBO
Как попробовать:
- зайти на сайт Dream;
- в окне Prompt вбить текстовое описание на английском языке;
- выбрать стиль картинки и кликнуть Create;
- нажать Save, также можно повторить попытку генерации, нажав Generate Again.
Сервис от канадского стартапа WOMBO позволяет создавать вертикальные обложки. При этом можно выбрать режим («Мистический», «Барокко», «Фэнтези» и так далее) и прикрепить картинку-референс, а также собственный NFT (невзаимозаменяемый токен). Нейросеть выдает абстрактные результаты. Генерация картинки происходит в режиме реального времени. Веб-версия сервиса бесплатна.
В мае 2022 года Google также показала свою нейросеть Imagen, которая генерирует изображения на основе текста методом диффузии: начинает со схематичного изображения и улучшает его. Сначала Imagen создает изображение 64×64 пикселя, но потом доводит его до 1024×1024 пикселя. В итоге картинка получает настолько высокую детализацию, что ее можно принять за фотоснимок.
Картинка, сгенерированная Imagen / Google AI
Сначала Google открыла свой сервис для ограниченного бета-тестирования, но теперь оно, похоже, закрыто. Видимо, в ближайшем будущем Imagen станет общедоступным.
Russian DALL-E
Russian DALL-E
ВСЕ
ruDALL-E Malevich
ruDALL-E Kandinsky
Kandinsky 2. 0
Очень красивый водопад в горах, импрессионизм,сюрреализм
Нижегородцев угораздило стать косатками
Клубничное песочное печенье
Казахский орнамент графика
Безумие глаз абстракция
Жареный рис
Плохая собака
Футбольный мяч в космосе
Закат и город
Треугольник, логотип
Городская аномалия
Кибергопник 69
Фурри девочка
Ньюфаундленд
Красный маг хаоса
Кошка, одетая в корону
Автомобиль на фоне города россии
Шиба-ину
Обычный русский уездный город
Звездный городок в полнолуние
Луначарского 134 город пермь
Дом с красной крышей и огородом
Подсолнухи в вазе, Винсент Ван Гог
Барбара
Медведь царь в короне
Кофе в постель
Ван гог стиль портрет красивой молодой девушки с распущенными волосами
Сильвана
Пахлава
Интерьер дюрера киберпанк
Неизвестная картина Ван Гога
Улица самого уютного города ночью в дождь
Картошка, стилизованная под аниме, с эффектами электрических разрядов, на фоне современного города в неоновомкибепанк стиле
Обложка для песни
Солнечная система
Самоед
Очень красивый водопад в горах
Духовные фрактальные сновидения Иннокентия за 2077 год
Мультфильм про санта-клауса
Жареные кальмары
Милый ленивец держит в руках небольшой сундук с сокровищами
Мороженое
Роботы апокалипсис
Высшая математика
Владимир Ленин
Аниме-тян
Флаг Германии
Программист работает
Лань ванцзи
Фрактал красивый город белые луки
Сюрреализм, стиль
Подсобные помещения
Композитор Дмитрий Шостакович
Визуализация нейронной сети
Визуализация простой нейронной сети для учебных целей.
Размер сети
Настройки обучения
Скорость обучения:
0.0010.0030.010.030.10.3131030
Регуляризация:
НетL1L2
Скорость регуляризации:
0.000010.000030.00010.00030.0010.0030.010.030.10.3131030
Поезд
Кол. итераций:
Текущая итерация:
0
Ввод обучающего набора
[
[[1,1],[0]],
[[1,0],[1]],
[[0,1],[1]],
[[0,0],[0]]
]
Тренировочный набор
Повторение
Стоимость:
Это реализация нейронной сети с обратным распространением. Никаких особых хитростей нет, это как
простой нейронный
сети как получится.
Функция стоимости 92\). Чтобы получить ошибку нейронной сети для одной обучающей выборки,
ты
просто добавьте ошибки всех выходных нейронов.
Затем общая стоимость определяется как средняя ошибка всего обучения.
образцы.
Прямое распространение
Предположим, что значение соединения равно весу соединения (насколько оно велико), умноженному на первое соединение.
нейрон. Вычислять
значение некоторого нейрона вы добавляете значения всех входящих соединений и применяете
сигмовидной функции к этой сумме. Другой
возможны функции активации, но я их еще не реализовал.
92\) зависит от x и y. В начале веса случайны. Допустим, x = 5 и y = 3. Стоимость
в
эта точка была бы 25 + 9 = 34, которую мы хотим получить до 0. Теперь мы возьмем производную по каждому из
эти
веса, который говорит нам, как настроить веса, чтобы минимизировать функцию. \(\ гидроразрыв {\ парциальное е (х, у)} {\ парциальное
Икс}
= 2x\), \(\frac{\partial f(x, y)}{\partial y} = 2y\). Теперь, когда у нас есть производные, мы знаем «направление».
в
что менять вес. \(x_{новый} = x_{старый} — скорость \times 2x = 5 — 0,1 \times 2 \times 5 = 4\), и это
а
немного ближе к желаемому 0 результату f(x, y). Ставка необходима, чтобы не перешагнуть через минимум.
На практике вычисление производных немного сложнее, но все, что вам нужно знать, это
Цепное правило . я очень рекомендую
серия 3blue1brown и
это
бумаги для лучшего понимания.
Если вам понравился этот проект, вам также может понравиться мой инструмент для создания gif-мемов.
Создано
Петр Кубеш,
исходный код
Скалистая игровая площадка нейронной сети
Данные
Загрузите свой JSON:
file_upload
Или используйте синтетические данные:
Или попробуйте реальные данные:
Соотношение поезд:тест: XX%
Шум: XX
Размер партии: XX
Особенности
Какие свойства вы хотите передать?
Щелкните в любом месте для редактирования.
Вес/смещение 0,2.
Это выход одного нейрона . Наведите курсор, чтобы увидеть его крупнее.
Выходные данные смешиваются с различными весами , показанными толщиной линий.
Выход
Цвета показывают данные, нейроны и значения веса.
Показать тестовые данные
Дискретный вывод
Эта нейронная сеть как функция Python
Что такое нейронная сеть?
Это метод создания компьютерной программы, которая учится на данных, очень слабо основанных на том, как работает мозг. Программные «нейроны» связаны друг с другом, что позволяет им отправлять сообщения друг другу. Сеть просят решить проблему, и она пытается делать это снова и снова, каждый раз укрепляя связи, ведущие к успеху, и ослабляя те, которые ведут к неудаче. Для более подробного ознакомления с нейронными сетями лучше всего начать с книги Майкла Нильсена «Нейронные сети и глубокое обучение».
Подробнее о наборах данных
Точки данных масштабированы и безразмерны, поэтому может быть трудно сказать, что они представляют. Итак, вот краткое описание.
Классификационные наборы данных
Линейный — Набор данных, который линейно разделим по измерению X 1 . Вам понадобится только одна функция и один нейрон, чтобы изучить эту связь.
Диагональ — Два класса сгруппированы по диагонали, поэтому для создания адекватного классификатора вам потребуется более одного признака. Обратите внимание, что данные обучения не охватывают домен данных, в отличие от данных проверки, поэтому дисперсия в этом наборе данных всегда высока.
Исключающее ИЛИ (XOR) — это классическая проблема в исследованиях нейронных сетей. Это простейшая из существующих задач нелинейно разделимой классификации.
Gaussian — Задача классификации с кластерами (или каплями), каждый из которых представлен гауссовым распределением. Измените уровень шума, чтобы расширить или сузить распределение.
Circle — Экземпляры одного класса окружают экземпляры другого.
Спираль – Два класса, вращающихся вокруг друг друга.
Луны – Две чередующиеся луны или круассаны, если хотите. Вдохновлен набором данных sklearn
.
Реальные данные: песок против сланца – Это значения скорости P-волны (X 1 ) и объемной плотности (X 2 ) для выборки песчаников (голубой) и сланцев (темно-синий) из Скалы. Каталог недвижимости. Стандартный скаляр был применен к характеристикам, затем умножен на 2.
Реальные данные: поропроницаемость – Пористость (X 1 ) и десятичный логарифм проницаемости (X 2 ) олигоценовых песчаников. Средне-крупнозернистые пески отмечены голубым цветом, мелко- и среднезернистые пески — темно-синим. Набор данных изменен из Taylor et al. 1993 г., набор данных номер 64 в отчете Геологической службы США 03-420 о пористости и проницаемости пробок керна в кремнепластических породах.
Наборы данных регрессии
Плоскость – Координаты данных выборки наклонной плоской поверхности.
Мультигауссовская – множественные кластеры с гауссовым пространственным распределением.
Реальные данные: Пористость — это небольшой набор данных, представляющий карту пористости. Это от Джеффа Болинга из Геологической службы Канзаса, но мы больше не можем найти данные в Интернете.
Реальные данные: DTS из DTP и RHOB – Прогнозирование акустических измерений S-волн на кабеле по скорости сжатия (DTP) (X 1 ) и объемной плотности (X 2 ). Данные даундискретизированы по скважине Р-39.офшор Новой Шотландии, доступный от CNSOPB.
Как создать собственные наборы данных?
Вам потребуется определить задачу машинного обучения с двумя функциями и одной целью. В идеале около 400 записей — разделите 50 % положительных и 50 % отрицательных классов для задачи классификации. Функции будут масштабироваться с использованием стандартизации Z-оценки (умноженной на 2 по сложным причинам). Цель должна быть -1 и 1 для классификации или в диапазоне [-1, 1] для регрессии. Вот пример того, как подготовить данные.
Если у вас есть файл JSON, вы можете загрузить его с помощью кнопки со значком file_upload (вверху слева).
Credits
Этот форк TensorFlow Playground был адаптирован Мэттом Холлом и Эваном Бьянко из Agile Scientific. Это один из экспериментов Agile с geosci.ai.
Вот что мы добавили или изменили:
- Добавлено несколько новых реальных и синтетических наборов данных с описаниями.
- Дополнительные функции активации, включая ELU и Swish.
- Измените регуляризацию во время тренировки и следите за весами.
- Загрузите свои собственные наборы данных!
- См.