Google нейросеть: Google представила нейросеть Imagen, которая генерирует изображения по описанию / Хабр

В Google создали нейросеть, способную редактировать фотографии по описанию — Газета.Ru

В Google создали нейросеть, способную редактировать фотографии по описанию — Газета.Ru | Новости

close

100%

Создана программа для автоматического редактирования фотографий по текстовому описанию. Об этом сообщает издание N+1.

В последние несколько лет появилось множество алгоритмов на основе нейросетевых технологий, способных генерировать фотореалистичные изображения или видеозаписи. Исходной информацией для подобных алгоритмов служит короткое текстовое описание.

Теперь Михаль Ирани из компании Google и его коллеги создали систему редактирования изображений, работающую на схожем принципе. Работа программы состоит из трех этапов. Человек загружает исходное изображение и пишет текстовое описание, что с ним надо сделать, например, фотографию сидящей птицы и текст «летящая птица». На первом этапе эта фраза превращается в эмбеддинг, а затем оптимизируется так, чтобы сгенерированное на его базе изображение было похоже на исходное. На втором этапе уже сама диффузионная генеративная нейросеть оптимизируется так, чтобы в ответ на оптимизированный эмбеддинг генерировать изображения, похожие на оригинал. А на третьем этапе происходит линейная интерполяция между исходным и оптимизированным эмбеддингами, а результат подается на оптимизированную нейросеть. Тесты показали, что такая схема позволяет менять только нужные детали на изображении и оставляет в практически неизменном виде остальные.

Ранее физики смогли превратить чистую воду в золотистый металл.

Подписывайтесь на «Газету.Ru» в Новостях, Дзен и Telegram.
Чтобы сообщить об ошибке, выделите текст и нажмите Ctrl+Enter

Новости

Дзен

Telegram

Марина Ярдаева

Хотеть не вредно

О тех, кому достаточно три аршина земли

Юлия Меламед

Журналист глобус пропил

Об экопарк-отелях и русских памятниках в России и Европе

Георгий Бовт

Не догонишь – не похоронишь

О том, как мы хотели перегнать Америку, но потом передумали

Алексей Мухин

Хромая утка по-пекински

О возможном конфликте США и Китая

Мария Дегтерева

Там чудеса, там леший бродит

О бюрократии и чиновничестве в России

Найдена ошибка?

Закрыть

Спасибо за ваше сообщение, мы скоро все поправим.

Продолжить чтение

Новую нейросеть от Google научили генерировать картинки по текстовому описанию

Американская корпорация Google представила нейросеть Imagen, которая генерирует фотореалистичные изображения из текстового описания. В компании утверждают, что их разработка лучше аналогичной нейросети DALL-E от OpenAI как по точности, так и по достоверности.






Предыдущая фотография



Изображение, сгенерированное нейросетью Imagen


Фото:
Google



Изображение, сгенерированное нейросетью Imagen


Фото:
Google



25. 05.2022
Изображение, сгенерированное нейросетью Imagen


Фото:
Google



Изображение, сгенерированное нейросетью Imagen


Фото:
Google



Изображение, сгенерированное нейросетью Imagen


Фото:
Google






Следующая фотография


1
/
5

Изображение, сгенерированное нейросетью Imagen


Фото:
Google

Изображение, сгенерированное нейросетью Imagen


Фото:
Google

25. 05.2022
Изображение, сгенерированное нейросетью Imagen


Фото:
Google

Изображение, сгенерированное нейросетью Imagen


Фото:
Google

Изображение, сгенерированное нейросетью Imagen


Фото:
Google

Для генерации изображений нейросеть использует метод диффузии: сначала делается небольшой схематичный набросок, который дальше улучшается и увеличивается в разрешении до тех пор, пока не будет максимально соответствовать запросу. У нейросети получилось, например, сделать изображения с текстовым описанием «очень злая птица» или «изображение собаки корги на велосипеде на Таймс-сквер — на ней солнцезащитные очки и пляжная шляпа».

В ноябре 2021 года «Сбер» представил свою аналогичную нейросеть под названием ruDALL-E. Как заявляли авторы, система может использоваться для разработки дизайна интерьера, векторных иллюстраций, материалов для рекламы и создания стоковых картинок.


Еще больше новостей — в Telegram-канале «Коммерсантъ».

Евгений Федуненко











Строительные сверточные нейронные сети в Google Cloud

  1. Home
  2. org/ListItem»> Обучающая библиотека
  3. Google Cloud Platform
  4. Курсы
  5. СОВЕТСТВЕННЫЕ СВОБОДНЫЕ НЕРНАЛЬНЫЕ СЕТЫ В Google Cloud

Содержание

Keybods_tab

ВВЕДЕНИЕ
COVENTENTS

NEARLOURAL

. Модель
Масштабирование
Заключение

Курс является частью этих схем обучения

Машинное обучение на Google Cloud Platform

Google Professional Data Engineer Exam Preparation

Introduction

Overview

Difficulty

Advanced

Duration

38m

Students

1784

Ratings

4. 8/5

starstarstarstarstar-half

Description

Once you знаете, как создавать и обучать нейронные сети с помощью TensorFlow и Google Cloud Machine Learning Engine, что дальше? Вскоре вы обнаружите, что предварительно созданные оценщики и конфигурации по умолчанию не помогут вам. Чтобы оптимизировать свои модели, вам может потребоваться создать свои собственные оценщики, попробовать различные методы для уменьшения переобучения и использовать пользовательские кластеры для обучения ваших моделей.

Сверточные нейронные сети (CNN) очень хорошо справляются с определенными задачами, особенно с распознаванием объектов на изображениях и видео. Фактически, они являются одной из технологий, используемых в беспилотных автомобилях. В этом курсе вы будете следовать практическим примерам создания CNN, обучать ее с помощью пользовательского уровня масштабирования в Machine Learning Engine и визуализировать ее производительность. Вы также узнаете, как распознать переобучение и применять различные методы, чтобы его избежать.

Цели обучения

  • Создание сверточной нейронной сети в TensorFlow
  • Анализ эффективности обучения модели с помощью TensorBoard
  • Выявление случаев переоснащения и применение методов для его предотвращения
  • Масштабирование задания Cloud ML Engine с помощью пользовательской конфигурации

Предполагаемая аудитория

  • Специалисты по обработке данных
  • Люди, готовящиеся к экзамену Google Certified Professional Data Engineer

Предварительные требования

  • Введение в курс Google AI Platform
  • Рекомендуется учетная запись Google Cloud Platform (зарегистрируйтесь для получения бесплатной пробной версии на https://cloud.google.com/free, если у вас нет учетной записи)

Ресурсы

Репозиторий GitHub для этого курса находится по адресу https://github.com/cloudacademy/ml-engine-doing-more.

Стенограмма

Добро пожаловать в раздел «Создание сверточных нейронных сетей в облаке Google». Меня зовут Гай Хаммел, и я покажу вам, как создавать более сложные нейронные сети и тренировать их с помощью Machine Learning Engine. Я являюсь руководителем Google Cloud Content в Cloud Academy, а также сертифицированным профессиональным облачным архитектором и инженером данных Google. Если у вас есть какие-либо вопросы, не стесняйтесь связаться со мной в LinkedIn и отправить мне сообщение или отправить электронное письмо по адресу [email protected].

 

Этот курс предназначен для специалистов по данным, особенно для тех, кому необходимо проектировать и создавать системы обработки больших данных. Это важный курс, который нужно пройти, если вы готовитесь к экзамену Google Professional Data Engineer.

 

Чтобы получить максимальную отдачу от этого курса, вы должны пройти курс «Введение в Google Cloud Machine Learning Engine», прежде чем приступить к этому, если у вас еще нет большого опыта работы с машинным обучением, TensorFlow и ML Engine.

 

Я еще раз покажу вам, как запускать примеры в ML Engine, поэтому я рекомендую, если у вас еще нет учетной записи Google Cloud, подписаться на бесплатную пробную версию.

 

В этом курсе мы будем работать со сверточными нейронными сетями, которые оказались очень полезными моделями для некоторых важных приложений машинного обучения.

 

Начнем с обзора сверточных нейронных сетей. Затем я покажу вам, как создать и обучить его с помощью TensorFlow.

 

Далее мы рассмотрим, как улучшить модель машинного обучения. Во-первых, мы будем использовать TensorBoard, чтобы визуализировать работу модели. Затем я объясню проблему переобучения и различные методы предотвращения этого.

 

Наконец, я покажу вам, как масштабировать ваши учебные задания на ML Engine.

 

К концу этого курса вы должны уметь создавать сверточные нейронные сети в TensorFlow, анализировать эффективность обучения модели с помощью TensorBoard, выявлять случаи переобучения и применять методы для их предотвращения, а также масштабировать Cloud ML. Работа двигателя с использованием пользовательской конфигурации.

 

Мы будем рады получить ваши отзывы об этом курсе, поэтому, когда вы закончите, оцените его как большой палец вверх или вниз.

 

Теперь, если вы готовы делать больше с помощью машинного обучения в Google Cloud, давайте начнем.

Об авторе

Студенты

171751

Курсы

98

Пути обучения

147

Guy1 помогает изучать ИТ-технологии с тех пор, как он запустил свой первый обучающий веб-сайт. Он был системным администратором, инструктором, инженером по продажам, ИТ-менеджером и предпринимателем. В своем последнем предприятии он основал и возглавил компанию, занимающуюся облачной инфраструктурой обучения, которая предоставила виртуальные лаборатории некоторым из крупнейших поставщиков программного обеспечения в мире. Страсть Гая — сделать сложные технологии простыми для понимания. Его деятельность вне работы включала катание на слоне и прыжки с парашютом (хотя и не одновременно).

Машинное обучениеИскусственный интеллектОблачная платформа GoogleИскусственный интеллект для GoogleПлатформа Google AI

Изучение глубоких нейронных сетей с помощью Google DeepDream | by Steve Condylios

Генеративное искусство — визуальные интересные явления, созданные с помощью кода — может принимать разные формы. Но немногие из них столь же увлекательны и проницательны, как DeepDream от Google, который использует нейронную сеть для обратного проектирования изображений. Это обобщает открытия, сделанные за несколько часов работы с инструментом.

ПРИМЕЧАНИЕ: изображения в высоком разрешении, и те, которые кажутся размытыми, вероятно, еще не загружены — дайте им минуту!

Нейросетевые классификаторы изображений работают путем обучения слоев нейронов, чтобы взять на себя ответственность за определение все более сложных и высокоуровневых функций в изображениях.

Например, классификатор, обученный на изображениях собак, может искать чрезвычайно простые формы в первых двух слоях, простые наборы линий или кривых, которые начинают напоминать мех или глаза в следующих слоях, и более сложные особенности (например, все лицо или тело) в более поздних слоях. Он объединяет их для «распознавания» полных изображений собак в выходном слое.

Глубокий сон Google делает что-то странное (и веселое). Вместо того, чтобы брать тысячи (или миллионы) изображений и обучать модель распознавать новые изображения на основе тех, на которых она училась, требуется предварительно обученная модель и обратное проектирование изображения , чтобы максимизировать активацию определенных слоев (или нейронов). в нейронной сети.

По часовой стрелке сверху слева: исходное изображение, оптимизированное для первого, второго и третьего слоев нейронной сети соответственно

Например, предположим, что мы стремимся максимизировать активацию первого слоя, мы должны ожидать увидеть изображение, которое начинает показывать более простые формы — такие как линии и кривые. Если мы максимизируем второй слой, мы можем ожидать увидеть более сложные формы. Если мы максимально активируем средний или более поздние слои, мы можем ожидать, что на фотографии появятся более сложные черты — такие вещи, как глаза, другие черты лица, силуэты, напоминающие формы тела.

Возможно, больше всего в этом впечатляет интуиция, которую она дает нам относительно внутренней работы нейронной сети: работая с различными слоями (или отдельными нейронами в этих слоях), мы можем четко видеть, за что они отвечают, и мы можно увидеть, как эти функции становятся все более изощренными по мере того, как мы углубляемся в сеть!

Самое интересное в этом то, что мы можем очень четко видеть, как меняется изображение, когда оно настраивается на максимальную активацию различных слоев нейронной сети

Ниже представлено стандартное изображение, а также то же изображение, полученное путем обратного проектирования для оптимизации функции активации для каждого из первых трех слоев нейронной сети, обученной распознавать собак. Обратите внимание на интересные узоры. Тем не менее, мы пока не видим ничего особенно узнаваемого, кроме простых линий, кривых и некоторых простых форм (во всяком случае, ничего явно собачьего!):

По часовой стрелке сверху слева: исходное изображение, оптимизированное для первого, второго и третьи слои нейронной сети соответственно

Но вещи меняются вокруг четвертого слоя и выше, поскольку признаки становятся достаточно сложными комбинациями признаков более низкого уровня, чтобы их можно было распознать, хотя бы частично, как отчетливо собачьи!

При увеличении мы можем различить отчетливые собачьи черты, которые начинают проявляться. Это результат оптимизации шестого уровня:

Шестой уровень сети явно отвечает за обнаружение более сложных функций, таких как глаза, нос и шерсть собак. Графика

SVG не является препятствием — ее нужно только экспортировать в jpg, прежде чем ее тоже можно будет использовать в качестве входных данных. Текстуры и простые формы, создаваемые третьим слоем модели, очень подходят Лил Рексу — кожа выглядит как живая!

Оригинал против оптимизации 3-го слоя — посмотрите на кожу динозавра-рептилии!

На некоторых ggplots эффекты были не такими впечатляющими.