Содержание
Искусственный интеллект в современном искусстве
По-видимому, мы уже находимся на пороге новой эры творчества, когда ИИ и художник становятся соавторами, дополняя друг друга в тех областях и «умениях», где они наиболее сильны, полагают Александра Степаненко, Сергей Каменщиков и Николай Суетин из департамента по науке и образованию Фонда «Сколково».
Из всех вопросов, которыми задаются люди в последние недели и месяцы, этот не принадлежит к числу наиболее очевидных. Между тем пауза, возникшая в результате пандемии, хороша именно для того, чтобы осмыслить новые реалии, которые возникли в результате активного применения цифровых технологий, но на рефлексию о которых всегда не хватало времени в обычной ситуации.
Статья написана специально для сайта Sk.ru.
Влияние новых технологий на характер творческих процессов
Новые цифровые технологии, в частности искусственный интеллект, кардинально меняют характер не только «традиционных» технических профессий, но и проникли в художественную среду, влияют на творческие процессы, и даже возник феномен под названием цифровое искусство.
Они уже начали играть очень важную роль в творческой деятельности, такой как музыка, архитектура, изобразительное искусство. Без использования цифровой обработки и компьютерных эффектов невозможно себе представить ни современный кинематограф, ни музыку. «Компьютер» в наши дни в прямом смысле стал и холстом, и кистью, и музыкальным инструментом. По-видимому, следующей ступенью в развитии цифрового искусства станет использование «компьютера» уже не только в качестве инструмента реализации идей человека, а в качестве самостоятельной творческой сущности. Эта точка зрения вызвала новое направление искусственного интеллекта (ИИ) под названием вычислительное творчество. [1]
По-видимому, мы уже находимся на пороге новой эры творчества, когда ИИ и художник становятся соавторами, дополняя друг друга в тех областях и «умениях», где они наиболее сильны.
При этом развитие цифрового искусства поднимает новый вопрос: может ли AI стать не просто инструментом художника, а самостоятельным автором?
Для того, чтобы это понять, рассмотрим существующие методы работы с изображением и постараемся выяснить, могут ли они претендовать на самостоятельность в творчестве.
Neural style transfer
Neural style transfer – это самая простая и популярная форма использования ИИ в творчестве. Модель основана на стилизации изображения и построена на основе сверхточных нейронных сетей (CNN). Она внедрена в такие популярные мобильные приложения, как DeepArt и Prisma. На входе модели два изображения – шаблон-стиль и оригинал. При высокой стилизации алгоритм оптимизирует параметры таким образом, что результаты преобразования шаблона и оригинала максимально близки в промежуточных слоях CNN, которые отвечают за метаобраз. Фактор стилизации может регулироваться. Технология позволяет успешно имитировать стиль Ван Гога, Моне по библиотеке шаблонов. Каждому шаблону соответствует сет параметров предобученной нейронной сети. Технология позволяет использовать образы персонажей в рекламе и продвижении товара.
При использовании такого рода технологий неизбежно возникает вопрос об авторском праве. Стилизация известных персонажей ставит вопрос, где проходит граница между ними и оригиналом и как защитить авторские права носителям бренда. По-видимому, ИИ сможет решить и этот вопрос, создавая собирательный образ на основании узнаваемых брендов, дополняя его “случайным шумом”.
Изображение: https://neurohive.io/ru/papers/twingan-mezhdomennyj-perenos-chelovecheskih-portretov/
Результат обработки в промежуточных слоях нейронной сети также используется в технологии DeepDreamот компании Google в 2015 г. Результат применения ближе всего к стилю позднего Дали и психоделическому искусству 80-х годов. Если на вход модели подается фотография реального объекта, то результат сложно отличить от работы художника – технология проходит тест Тьюринга. Параметром модели является глубина обработки – фактически номер слоя нейронной сети.
Изображение создано с помощью DeepDreamGenerator (А. Степаненко) — https://deepdreamgenerator.com/.
На данный момент фреймворк TensorFlow позволяет внедрить модель на локальной машине при помощи нескольких строчек кода.
GAN
Современное искусство, основанное на технологиях искусственного интеллекта, привлекло внимание прессы и широкой общественности после продажи созданной французской арт-группой Obvious картины «Эдмона де Белами» на аукционе Christie’s 25 октября 2018 года, за 432,5 тыс. долларов». Произведение представляет собой нечеткий портрет человека, который был распечатан на холсте размером 700 x 700 мм. Он был создан с использованием GAN (Generative Adversarial Network). Технология состоит в использовании двух нейронных сетей, одна из которых генерирует псевдослучайные образы из заданного набора распределений, а вторая (CNN дискриминатор) определяет правдоподобие образа на основе тренировочного набора. CNN является бинарным классификатором и пытается ответить на вопрос: ‘образец создан человеком?’ Если ответ отрицательный, то пример маркируется как неудачный. Обучается сеть по размеченному набору из фейковых и созданных человеком образов. Обе нейронные сети связаны по замкнутом контуру.
Пьер Фотрел (Pierre Fautrel), соучредитель художественного коллектива Obvious, рядом с картиной «Портрет Эдмона де Белами» — (Timothy A. Clary / AFP / Getty).
Большинство первопроходцев в сфере AI Art использует именно GAN. Среди них можно отметить Анну Ридлер, которая считает, что данные сети дают наиболее визуально интересные результаты. Он создала тренировочный набор из 10000 фотографий тюльпанов в течение сезона и классифицировала их вручную. Затем использовала софт для создания видео, показывающего цветение тюльпанов. Их появление определялось волатильностью биткойна, а полоски на лепестках отражали текущую цену криптовалюты. Работа проводит исторические параллели между «тюльпановой манией», охватившей Европу в 1630-х годах, и спекуляциями на криптовалютах.
Anna Ridler, Tulips from Mosaic Virus (2018). — https://news.artnet.com/market/9-artists-artificial-intelligence-1384207.
Другой неординарный автор, использующий GAN, – Хелена Сарин; она художница в более традиционном понимании, которая пользуется GAN для преобразования и улучшения своих собственных набросков, созданных карандашом на бумаге. Сарин использует исключительно CycleGAN, вариант GAN, который выполняет преобразование одного изображения в новое. По сути, она обучает сеть преобразовывать изображения в форме одного набора данных, чтобы иметь текстуры другого набора данных. Например, она переводит свои фотографии еды и напитков в стиль своих натюрмортов и эскизов цветов. Хелена объясняет, что одним из преимуществ использования CycleGAN является то, что она может работать в высоком разрешении даже с небольшими наборами данных.
Helena Sarin, Pretty in GAN — https://computervisionart.com/pieces/pretty-in-gan/.
«Стилизация изображений, которую использует Хелена Сарин в своем творчестве, требует художественного вкуса и таланта. Ее полотна – это симбиоз вдохновения и специфической, кропотливой настройки нейронной сети. Но эта технология постепенно становится доступной и для неподготовленного дилетанта. Порог входа снижается благодаря технологии image2image DeepFace, разработанной в Академии Наук Китая.
Модель позволяет на основе непрофессионального эскиза получить фотографию, наиболее близкую к шаблону. При этом для обучения модели используется библиотека фотографий человеческих лиц. Сама модель является ансамблем из двух алгоритмов: декодера эскиза и генеративно-состязательной нейронной сети (GAN) для сопоставления с фотографией. Библиотека фотографий, которая подается на вход модели, предварительно преобразуется в отображения – эскизы. Набросок автора конвертируется в векторное представление при помощи декодера.
Есть дополнительная революционная опция — прозрачные тени наиболее подходящего изображения могут быть наложены на исходный эскиз, что позволяет художнику дополнить его на основе типичных пропорций лица. Таким образом творчество превращается в итеративный процесс, симфонию автора и машины, которая требует минимальной подготовки человека – машине достаточно намека.
Можно предположить, что в перспективе коллекция фотографий в обучающем сете модели может быть стилизована под работы художников и целые направления. Уже сейчас полученную фотографию можно подать на вход CAN (creative adversarial network) с библиотекой полотен известных мастеров, то есть последовательно создать стилизованное полотно на основе простейшего эскиза
CAN
Еще один тип CAN (creative adversarial networks) работает по тому же принципу, что и GAN за исключением одной важной детали. Дискриминатор имеет множество классов, каждый из которых соответствует своему стилю – импрессионисты, сюрриалисты и т.д. Таким образом, на выходе генератора остаются стилизованные образы. Пример – картина “Летние сады” итальянского художника Давиде Квайолы, представленная на выставке “ Искусственный интеллект и диалог культур” в Эрмитаже. Давиде снял на видео цветы, которые поздним вечером колеблются от порывов ветра. Дальше работать стал не художник, а креативно-состязательная сеть – преобразуя полученную информацию в полотна французских импрессионистов. При этом палитра и движения на видео остаются неизменными: сеть создает поверх исходных данных новую живопись.
Quayola. Видеоинсталляция «Летние сады» (А. Семенович) — https://www.colta.ru/articles/art/21654-pridvornaya-neyroset?page=8.
Скульптура
Скульптуры, созданные искусственным интеллектом, пока не так популярны, как картины, однако развитие в данном направлении все же есть. В основном AI используется либо для создания GAN-макета, либо непосредственно для разработки объемной модели. Скульптура Скотта Итана дебютировала на выставке ‘Artist + AI: figures and forms’ и была создана в сотрудничестве с инструментами искусственного интеллекта. В данном случае AI переводит рисунки в трехмерную форму. Другой пример – технология ‘Dio’ Бена Снэлла, суть которой не раскрывается. Обучающий сет состоял из 1000 классических скульптур. По словам художника, его основная цель заключалась не в том, чтобы сделать DIO человечной.
Human Allocation of Space, 2019. Bronze, 50 x 75 x 25 cm — http://www.scott-eaton.com/2019/artist-plus-ai-sculpture.
Резюме
Технологии Neural style transfer, Deep Dream позволяют создавать объекты, которые во многих случаях не отличаются от творений человека. Генерация случайных образов в технологии CAN добавляет спонтанность в творчество искусственного интеллекта и позволяет сделать шаг вперед по сравнению с глубокой стилизацией. Безусловно, разрыв между AI и человеком сокращается. Тем не менее, по-видимому, в ближайшее время он не будет полностью преодолён, поскольку именно человек настраивает модель, подбирает обучающие примеры и использует технологии для творчества.
Идея о том, что машины могут быть художниками, или могут даже заменить художников, как они уже заменили некоторые профессии, выглядит пока слишком смелой.
Искусственный интеллект представляет экстраординарные инструменты работы и новое необычное экспериментальное поле для художников в сфере визуального искусства и индустрии развлечений (дизайн игр, кино – CGI и тд), а также упрощает и автоматизирует рутинные процессы. Однако, чем более автоматизированным становится процесс создания произведений искусства, тем выше возрастает ценность идеи, стоящей за ними.
Теперь, когда вопрос исполнения, физической реализации и наличия необходимых технических навыков отпадает, новые идеи являются основной движущей силой в развитии искусства. А генерация этих идей — эта та главная функция, которую искусственный интеллект не сможет (или пока не может) отобрать у творца.
[1] https://www.bbvaopenmind.com/en/articles/artificial-intelligence-and-the-arts-toward-computational-creativity/
Действительно ли искусственный интеллект настолько разумен, как мы думаем?
София — первый в мире робот-гуманоид (гиноид) с искусственным интеллектом. Её создали в Гонконге в 2015 году ученые компании Hanson Robotics, она способна имитировать 62 человеческие эмоции. Keystone / Ritchie B. Tongo
Компьютеры все чаще принимают за нас важные решения. Должны ли мы идти у них на поводу? Команда из швейцарского исследовательского института Idiap наглядно демонстрирует, что искусственный интеллект и наше нынешнее о нем представление являются по большей части иллюзией, навеянной научной фантастикой.
Этот контент был опубликован 25 февраля 2022 года — 07:00
Редактор русскоязычной версии Надежда Капоне.
Способны ли машины мыслить? Этим вопросом задался английский математик Алан Тьюринг (Alan Turing) в своей статье «Вычислительные машины и разум»Внешняя ссылка (Computing Machinery and Intelligence), опубликованной еще в 1950 году в философском журнале Mind. Его работа определила концепцию и заложила основу современной теории искусственного интеллекта (ИИ). Формулировка данной задачи не оставалась статичной, она развивалась. В одной из версий ученый предложил заменить вопрос «Думают ли машины?» вопросом «Могут ли машины делать то, что можем делать мы, люди, в качестве мыслящих созданий»?
Чтобы ответить на поставленный вопрос, А. Тьюринг предложил сыграть в «игру-имитацию», в которой задействованы три участника: игрок А — мужчина, игрок В — женщина и игрок С, который может быть любого пола и выступает в качестве ведущего. Ведущий С не видит двух других игроков и может общаться с ними только посредством письменных сообщений. Задавая вопросы игрокам А и В, ведущий С пытается определить, кто из них мужчина, а кто женщина. Задача игрока А, мужчины, — запутать игрока С, чтобы он сделал неправильный вывод. В то же время задача игрока В, женщины, состоит в том, чтобы помочь игроку С вынести верное суждение. Теперь представьте, что игрока А-мужчину заменили компьютером. А. Тьюринг указывал, что, если игрок С не может отличить компьютера от человека, то это значит, что компьютер может мыслить, и его следует считать разумным, поскольку он способен копировать когнитивные способности человека.
Показать больше
В самой последней версии этого теста речь идет о комитете экспертов, который задаёт вопросы компьютеру, а задача компьютера состоит в том, чтобы заставить значительную часть членов этого комитета поверить, что он на самом деле не компьютер, а человек. Сегодня так называемый «Тест Тьюринга» повсеместно используют для определения уровня машинного интеллекта. Стандартная современная формулировка теста выглядит следующим образом: «Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает, с человеком или компьютерной программой. Задача компьютерной программы — ввести человека в заблуждение, заставив сделать неверный выбор».
Не искусственный и не разумный
«На данный момент не существует ни одной системы искусственного интеллекта, которая бы прошла тест Тьюринга», — подчеркивает Эрве Бурлар (Hervé Bourlard), директор расположенного в городе Мартини (Martigny, кантон Вале) частного Научно-исследовательского института IdiapВнешняя ссылка (Institut d’intelligence artificielle perceptive), занимающегося изучением когнитивных технологий, искусственного интеллекта и технологий взаимодействия человека и машины. Институт сотрудничает с Университетом Женевы и Лозаннским политехом EPFL. В 1970-е годы ученые старались не использовать термин «искусственный интеллект» из-за разных несбывшихся прогнозов и курьезных случаев, с которыми тот ассоциировался.
«У искусственного интеллекта нет разума. Это некорректный термин и лучше говорить о методах машинного обучения», — говорит Эрве Бурлар, директор исследовательского института Idiap. Idiap
Снижение интереса к области ИИ в конечном итоге привело к сокращению финансирования и к сворачиванию многих крупных исследовательских проектов. Термин ИИ вернулся в моду в 1990-х «как часть маркетинговой политики, а также по соображениям рекламного и делового характера», — утверждает Эрве Бурлар, который также является профессором электротехники. «Однако возвращение термина в речевой обиход не сопровождалось каким-либо реальным научным прогрессом, за исключением более совершенных математических моделей, лежавших в основе технологий ИИ», — добавляет он. Он по-прежнему скептически относится к термину «искусственный интеллект» и смыслу, который сегодня вкладывают в это понятие.
Ученый утверждает, что «искусственного интеллекта» не существует, поскольку ни одна такая система не содержит в себе ни малейшего признака человеческого интеллекта. Даже двух- или трехмесячный младенец может делать то, чего никогда не сможет машина с ИИ. Взять хотя бы стакан воды на столе. Ребенок прекрасно сознаёт, что, если стакан перевернуть, то вода выльется, и он станет пустым. «Вот почему младенцам так нравится опрокидывать стаканы. Ни одна машина в мире не способна уяснить себе эту разницу», — говорит Эрве Бурлар. Это мнение ученого, как и пример со стаканом, оказываются приложимыми и в отношении обычного здравого смысла — то есть способности человека рационально рассуждать на основе самоочевидных принципов разума. Этой способности машины не смогут и, по словам Э. Бурлара, никогда в будущем не смогут имитировать.
Фундамент формирования искусственного интеллекта
Однако во многих отраслях экономики ИИ уже зарекомендовал себя вполне положительно, системы на его основе все более активно принимают участие в процессах принятия рутинных решений в таких областях, как кадровые ресурсы, страхование, банковское кредитование. Анализируя поведение людей во Всемирной паутине, машины могут «знать», кто мы такие в качестве пользователей и каковы наши в этом смысле предпочтения. Затем рекомендательные алгоритмы отфильтровывают менее значимую информацию и предлагают нам для просмотра в социальных сетях фильмы, новости или одежду, которая может нам понравиться. На этой основе соцсети зарабатывают себе рекламные деньги.
Но это по-прежнему не делает искусственный интеллект разумным, говорит Э. Бурлар. Он предпочитает поэтому использовать термин «машинное обучение». Он говорит, что есть три фактора, которые делают ИИ действительно мощным инструментом: вычислительные возможности, математическое моделирование интеллектуальных систем, а также обширные и всеобъемлющие базы данных. Постоянное увеличение мощности и производительности компьютеров наряду с оцифровкой огромных массивов данных уже позволили значительно улучшить математические модели, лежащие в основе ИИ. Интернет с его безграничными источниками цифровой информации довершил начатое, еще больше расширив возможности систем «искусственного интеллекта».
Посмотрите, как сотрудники научно-исследовательского института Idiap демонстрируют публике работу и возможности пользовательских ИИ-приложений:
На данный момент эксперты Idiap подготовили уже целый ряд интерактивных презентаций, в ходе которых они постарались продемонстрировать публике, насколько важны большие массивы данных для систем ИИ. Данная экспозиция будет представлена вниманию общественности с 1 апреля 2022 года в Musée de la mainВнешняя ссылка в Лозанне. Например, гости музея смогут воочию увидеть, как технология искусственного интеллекта, применяемая в фотокамерах наших смартфонов, способная значительно улучшать качество изображений с низким разрешением или, наоборот, ухудшать его, в зависимости от использованных тех или иных наборов критериев для их обработки.
На самом деле это очень сложный процесс. Для него требуется большой объем достоверных и точно аннотированных или «помеченных» человеком наборов данных, на основе которых компьютер способен «обучаться». «Мы имеем дело не с чем-то существующим самостоятельно, а с системой хранения и обработки накопленных массивов данных», — говорит Михаэль Либлинг (Michael Liebling), руководитель Лаборатории биовизуализации вычислений (Computational Bioimaging Group), существующей при институте Idiap.
Показать больше
Это означает, что технологии ИИ не являются абсолютно надежными. Размеры обрабатываемых массивов данных являются критерием предела возможностей машин. А это, по мнению Михаэля Либлинга, должно заставить нас задуматься о том, где кроется реальная опасность. «Действительно ли опасность заключается в том, что некая машина из мира научной фантастики начнет владеть миром? Или же она кроется в том, как мы распределяем и обрабатываем данные? Я считаю, что угроза заключается именно в том, как мы управляем данными, а не в самих машинах, которые их используют», — говорит он.
«Требуйте от системы объяснения»
Такие технологические гиганты, как Google и Facebook, отлично понимают, что потенциал моделей ИИ зависит от массивов накопленных цифровых данных. И это как раз и составляет научную основу их бизнеса. Но именно этот аспект, наряду с процессами автоматизации некоторых процессов и минимизации участия в них человека, в наибольшей степени и вызывает беспокойство научного сообщества. Бывшего исследователя и эксперта по этике компании Google Тимнит Гебру (Timnit Gebru) даже уволили за критику в адрес становящихся слишком мощными лингвистических моделей, использующих огромные объемы интернет-данных и составляющих основу самой востребованной в мире поисковой системы.
Недостаток таких моделей на основе машинного обучения заключается в том, что все они не обладают, или, по крайней мере, пока не продемонстрировали нам никаких способностей к логическому мышлению, которыми обладает человек. Компьютер может дать ответ на вопрос, но он не в состоянии объяснить, почему он пришел к такому выводу и это понятно: человек мыслит, а машина приходит к своему выводу «тупым» перебором вариантов. «Необходимо, чтобы существующие модели ИИ были понятными целевой аудитории»,- говорит Андре Фрайтас (André Freitas), возглавляющий в институте Idiap исследовательскую лабораторию обеспечения и регулирования прозрачности ИИ.
Показать больше
Хорошая новость, считает он, заключается в том, что научное сообщество в сфере искусственного интеллекта, раньше занимавшееся в основном повышением эффективности и точности соответствующих моделей и алгоритмов, теперь стремится разрабатывать этичные, понятные и безопасные модели, в рамках которых реализована в том числе и т.н. объяснительная компонента (элемент архитектуры экспертной системыВнешняя ссылка, который дает объяснение действий данной системы и отвечает на вопрос о том, почему и как данные заключения были сделаны или на каком основании они были отвергнуты). Лаборатория Андре Фрайтаса создает как раз модели искусственного интеллекта, которые способны ответить на вопрос о том, как было получено решение задачи, и какие знания при этом были использованы. А это резко повышает доверие пользователя к полученному результату.
Например, их модель умеет не только прогнозировать и давать рекомендации о порядке и сроках помещения в реанимацию больных коронавирусом, но и объяснять медицинскому персоналу, на каком основании сделаны эти выводы, а также представлять информацию о пределах возможностей данной модели. «Создавая модели искусственного интеллекта с наличием объяснительной компоненты, мы можем предоставлять пользователям инструментарий для выработки критического взгляда на ее недостатки и достоинства», — говорит А. Фрайтас. Задача в итоге заключается именно в том, чтобы обратить сложные алгоритмы и технический жаргон в нечто понятное и доступное. Требуйте от системы объяснения её действий, если вам придется иметь с ней дело. Такова его вполне практическая рекомендация на каждый день.
Видимость интеллекта
Искусственный интеллект часто называют основной движущей силой современных технологий. Поэтому закономерно, что работы в этой области вызывают энтузиазм и связаны с ожиданием получения практически значимых результатов. Нейрокомпьютеры, созданные на основе принципов работы естественных нейронных систем, уже хорошо себя зарекомендовали там, где ранее их использование было бы немыслимым. «Поэтому мы решили, что искусственный интеллект может обладать таким же интеллектом, что и мы, и что это поможет нам решить многие наши проблемы», — говорит Лоннеке ван дер Плас (Lonneke van der Plas).
Она руководит в институте Idiap Лабораторией вычислений, когнитивных и лингвистических способностей. В качестве примера она приводит растущий потенциал такого инструмента, как виртуальный ассистент (программный сервисный агент) на основе ИИ или сервис автоматического перевода. «Их возможности уже поразительны и мы склоняемся к мысли о том, что если компьютеру по силам освоить такую сложную знаковую систему, как язык, то здесь не обошлось без участия и его потенциальных интеллектуальных способностей».
Показать больше
Такие интеллектуальные персональные программные агенты уже могут имитировать нас, коль скоро их алгоритмы умеют выявлять закономерности в огромных массивах данных. Но при сравнении возможностей виртуального голосового ассистента, активируемого голосом, со способностями обычного ребенка в разговоре, например, о бумажном самолетике, первому, чтобы достичь уровня рассуждений ребенка, пока нынешних объемов данных недостаточно.
Виртуальному помощнику пока сложно усвоить обычные знания на уровне здравого смысла. «Способность говорить на человеческом языке не означает еще автоматически наличия в высказываемых суждениях того, что называется интеллектом», − говорит Л. Ван дер Плас. В конце концов, как сказал еще 70 лет назад Алан Тьюринг, не стоит пытаться очеловечивать «умную машину», наделяя ее эстетическими свойствами. «Не судите о книге по её обложке».
Показать больше
Показать больше
В соответствии со стандартами JTI
Показать больше: Сертификат по нормам JTI для портала SWI swissinfo.ch
Показать больше
как он работает, и уничтожит ли наше общество уже в этом году? / Хабр
Сегодняшний ИИ технически «слабый» – однако он сложный и может значительно повлиять на общество
Не нужно быть Киром Дулли, чтобы знать, насколько пугающим может стать хорошо соображающий искусственный интеллект [американский актёр, исполнявший роль астронавта Дэйва Боумена в фильме «Космическая одиссея 2001 года» / прим. перев.]
ИИ, или искусственный интеллект, сейчас одна из самых важных областей знания. Решаются «нерешаемые» задачи, инвестируются миллиарды долларов, а Microsoft даже нанимает Коммона, чтобы он рассказал нам поэтическим штилем, какая это замечательная штука – ИИ. Вот ведь.
И, как с любой новой технологией, бывает сложно пробраться через всю эту шумиху. Я годами занимаюсь исследованиями в области беспилотников и «ИИ», однако даже мне бывает сложно успевать за всем этим. В последние годы я много времени провёл в поисках ответов даже на простейшие вопросы типа:
- Что подразумевают люди, говоря «ИИ»?
- В чём разница между ИИ, машинным обучением и глубоким обучением?
- Что такого замечательного в глубоком обучении?
- Какие бывшие сложными задачи теперь решать легко, а что до сих пор тяжело?
Я знаю, что не один интересуюсь подобными вещами. Поэтому, если вам интересно, с чем связаны все эти восторги по поводу ИИ на простейшем уровне, пора заглянуть за кулисы. Если вы – эксперт по ИИ, и читаете отчёты с конференции по нейрологической обработке информации (NIPS) для развлечения, в статье ничего нового для вас не будет – однако мы ждём от вас уточнений и исправлений в комментариях.
Что такое ИИ?
В информатике есть такая старая шутка: в чём разница между ИИ и автоматизацией? Автоматизация – это то, что можно делать с помощью компьютера, а ИИ – это то, что мы хотели бы уметь делать. Как только мы узнаём, как что-то делать, это переходит из области ИИ в разряд автоматизации.
Эта шутка справедлива и сегодня, поскольку ИИ не определён достаточно чётко. «Искусственный интеллект» – это просто не технический термин. Если залезть в Википедию, то там написано, что ИИ – это «интеллект, демонстрируемый машинами, в отличие от естественного интеллекта, демонстрируемого людьми и другими животными». Менее чётко и не скажешь.
В целом, есть два типа ИИ: сильный и слабый. Сильный ИИ представляет себе большинство людей, когда слышат об ИИ – это какой-то богоподобный всезнающий интеллект типа Skynet или Hal 9000, способный на рассуждения и сравнимый с человеческим, при этом превосходящий его возможности.
Слабые ИИ – высоко специализированные алгоритмы, разработанные для получения ответов на определённые полезные вопросы в узко определённых областях. К примеру, в эту категорию попадает очень хорошая шахматная программа. То же можно сказать о ПО, очень точно подстраивающем страховые платежи. В своей области такие ИИ достигают впечатляющих результатов, но в целом они весьма ограничены.
За исключением голливудских опусов, сегодня мы даже близко не подошли к сильному ИИ. Пока что любой ИИ – слабый, и большинство исследователей в данной области согласны с тем, что придуманные нами техники создания прекрасных слабых ИИ, скорее всего, не приблизят нас к созданию сильного ИИ.
Так что сегодняшний ИИ представляет собой больше маркетинговый термин, чем технический. Причина, по которой компании рекламируют свой «ИИ» вместо «автоматизации» заключается в том, что они хотят внедрить в общественное сознание голливудский ИИ. Однако это не так уж и плохо. Если отнестись к этому не слишком строго, то компании хотят лишь сказать, что, хотя мы ещё очень далеко от сильного ИИ, сегодняшний слабый ИИ куда как способнее существовавших несколько лет назад.
И если отвлечься от маркетинга, то так оно и есть. В определённых областях возможности машин резко возросли, и в основном благодаря ещё двум модным нынче словосочетаниям: машинное обучение и глубокое обучение.
Кадр из короткого видео от инженеров Facebook, демонстрирующего, как ИИ в реальном времени распознаёт кошек (задача, также известная, как святой Грааль интернета)
Машинное обучение
МО – это особый способ создания машинного интеллекта. Допустим, вы хотите запустить ракету, и предсказать, куда она попадёт. В общем и целом это не так уж и сложно: гравитация довольно неплохо изучена, вы можете записать уравнения и рассчитать, куда она отправится, на основании нескольких переменных – таких, как скорость и начальная позиция.
Однако такой подход становится неуклюжим, если мы обращаемся к той области, правила которой не так хорошо известны и ясны. Допустим, вы хотите, чтобы компьютер сказал вам, есть ли на каких-то изображениях из выборки кошки. Как вы будете записывать правила, описывающие вид во всех возможных точек зрения на все возможные комбинации усов и ушей?
Сегодня МО-подход хорошо известен: вместо того, чтобы пытаться записать все правила, вы создаёте систему, способную самостоятельно вывести набор внутренних правил после изучения огромного количества примеров. Вместо того, чтобы описывать кошек, вы просто показываете своему ИИ кучу фотографий кошек, и даёте ему самостоятельно понять, что является кошкой, а что – нет.
И на сегодня это идеальный подход. Систему, самостоятельно обучающуюся правилам на основе данных, можно улучшать, просто добавляя данных. А если наш вид что-то и умеет очень хорошо делать, так это генерировать, хранить и управлять данными. Хотите научиться лучше распознавать кошек? Интернет генерирует миллионы примеров прямо в эту минуту.
Всё возрастающий поток данных – одна из причин взрывного роста алгоритмов МО в последнее время. Другие причины связаны с использованием этих данных.
Кроме данных, для МО есть ещё два связанных с этим вопроса:
- Как мне запомнить изученное? Как хранить и представлять на компьютере связи и правила, которые я вывел из данных?
- Как мне обучаться? Как изменять сохранённую репрезентацию в ответ на поступление новых примеров, и улучшаться?
Иначе говоря, что именно обучается на основе всех этих данных?
В МО вычислительным представлением обучения, которое мы храним, является модель. Тип используемой модели очень важен: он определяет то, как учится ваш ИИ, на каких данных он может обучаться, и какие вопросы можно будет ему задавать.
Давайте посмотрим на очень простой пример. Допустим, мы покупаем в продуктовом магазине инжир, и хотим сделать ИИ с МО, который говорил бы нам, спелый ли он. Это должно быть легко сделать, поскольку в случае инжира, чем он мягче, тем слаще.
Мы можем взять несколько образцов спелого и неспелого инжира, посмотреть, насколько они сладкие, а потом разместить их на графике и подстроить под него прямую. Эта прямая будет нашей моделью.
Зародыш ИИ в виде «чем они мягче, тем слаще»
С добавлением новых данных задача усложняется
Посмотрите-ка! Прямая неявным образом следует идее о том, что «чем они мягче, тем слаще», и нам даже не пришлось ничего записывать. Наш зародыш ИИ не знает ничего о содержании сахара или созревании фруктов, но может предсказывать сладость фрукта, сжимая его.
Как натренировать модель, чтобы она стала лучше? Мы можем собрать ещё больше образцов и провести ещё одну прямую, чтобы получить более точные предсказания (как на второй картинке выше). Однако проблемы сразу становятся очевидными. Пока что мы обучали наш инжирный ИИ на качественных ягодах – а что, если мы возьмём данные из фруктового сада? Внезапно у нас появляются не только спелые, но и гнилые фрукты. Они очень мягкие, но определённо не подходят для еды.
Что нам делать? Ну, раз это модель МО, мы просто можем скормить ей больше данных, правильно?
Как показывает первая картинка внизу, в этом случае мы получим совершенно бессмысленные результаты. Прямая просто не подходит для описания того, что происходит, когда фрукт становится слишком спелым. Наша модель уже не вписывается в структуру данных.
Вместо этого нам придётся её поменять, и использовать более хорошую и сложную модель – возможно, параболу, или что-то похожее. Это изменение усложняет обучение, потому что для рисования кривых требуется более сложная математика, чем для рисования прямой.
Ладно, наверное, идея использовать прямую для сложного ИИ была не очень удачной
Требуется математика посложнее
Пример довольно глупый, но он показывает, что выбор модели определяет возможности обучения. В случае инжира данные простые, и модели могут быть простыми. Но если вы пытаетесь обучиться чему-то более сложному, требуются более сложные модели. Точно так же, как никакое количество данных не заставит линейную модель отражать поведение гнилых ягод, так невозможно подобрать простую кривую, соответствующую куче картинок, чтобы создать алгоритм компьютерного зрения.
Поэтому трудность для МО состоит в создании и выборе правильных моделей для соответствующих задач. Нам нужна модель, достаточно сложная для того, чтобы описать на самом деле сложные связи и структуры, но достаточно простая для того, чтобы с ней можно было работать и тренировать её. Так что, хотя интернет, смартфоны и так далее породили невероятные горы данных, на которых можно обучаться, нам всё равно нужны правильные модели, чтобы воспользоваться этими данными.
Именно тут и вступает в игру глубокое обучение.
Глубокое обучение
Глубокое обучение – это машинное обучение, использующее модель определённого вида: глубокие нейросети.
Нейросети – это тип модели МО, использующей структуру, напоминающую нейроны в мозге, для вычислений и предсказаний. Нейроны в нейросетях организуются послойно: каждый слой выполняет набор простых вычислений и передаёт ответ следующему.
Послойная модель позволяет проводить более сложные вычисления. Простой сети с небольшим количеством слоёв нейронов достаточно для воспроизводства использовавшейся нами выше прямой или параболы. Глубокие нейросети – это нейросети с большим количеством слоёв, с десятками, или даже сотнями; отсюда и их название. С таким количеством слоёв можно создавать невероятно мощные модели.
Эта возможность – одна из основных причин огромной популярности глубоких нейросетей в последнее время. Они могут обучаться различным сложным вещам, не заставляя человека-исследователя определять какие-то правила, и это позволило нам создать алгоритмы, способные решать самые разные задачи, к которым раньше компьютеры не могли подступиться.
Однако в успех нейросетей сделал свой вклад и ещё один аспект: обучение.
«Память» модели – это набор числовых параметров, определяющий то, как она выдаёт ответы на задаваемые ей вопросы. Обучать модель – значит, подстраивать эти параметры так, чтобы модель выдавала наилучшие ответы из возможных.
В нашей модели с инжиром мы искали уравнение прямой. Это задача простой регрессии, и существуют формулы, которые дадут вам ответ за один шаг.
Простая нейросеть и глубокая нейросеть
С более сложными моделями всё не так просто. Прямую и параболу легко представить несколькими числами, но глубокая нейросеть может иметь миллионы параметров, а набор данных для её обучения также может состоять из миллионов примеров. Аналитического решения в один шаг не существует.
К счастью, существует один странный трюк: можно начать с плохой нейросети, а потом улучшать её при помощи постепенных подстроек.
Обучение модели МО таким способом похоже на проверку ученика при помощи тестов. Каждый раз мы получаем оценку, сравнивая то, какие ответы должны быть по мнению модели, с «правильными» ответами в обучающих данных. Затем мы проводим улучшение и запускаем проверку снова.
Как мы узнаем, какие параметры надо подстраивать, и насколько? У нейросетей есть такое прикольное свойство, когда для многих видов обучения можно не только получить оценку в тесте, но и подсчитать, насколько именно она изменится в ответ на изменение каждого параметра. Говоря математическим языком, оценка – это функция значения, и для большинства таких функций мы легко можем подсчитать градиент этой функции относительно пространства параметров.
Теперь мы точно знаем, в какую сторону надо подстраивать параметры для увеличения оценки, и можно подстраивать сеть последовательными шагами во всё лучших и лучших «направлениях», пока вы не дойдёте до точки, в которой уже ничего нельзя улучшить. Это часто называют восхождением на холм, поскольку это действительно похоже на движение вверх по холму: если постоянно двигаться вверх, в итоге попадёшь на вершину.
Видали? Вершина!
Благодаря этому нейросеть улучшать легко. Если ваша сеть обладает хорошей структурой, получив новые данные, вам не нужно начинать с нуля. Можно начать с имеющихся параметров, и заново обучиться на новых данных. Ваша сеть будет постепенно улучшаться. Наиболее видные из сегодняшних ИИ – от распознавания кошек на Facebook до технологий, которые (наверное) использует Amazon в магазинах без продавцов – построены на этом простом факте.
Это ключ ещё к одной причине, по которой ГО распространилось так быстро и так широко: восхождение на холм позволяет взять одну нейросеть, обученную какой-то задаче, и переобучить её на выполнение другой, но сходной. Если вы обучили ИИ хорошо распознавать кошек, эту сеть можно использовать для обучения ИИ, распознающего собак, или жирафов, без необходимости начинать с нуля. Начните с ИИ для кошек, оценивайте его по качеству распознавания собак, и потом забирайтесь на холм, улучшая сеть!
Поэтому в последние 5-6 лет произошло резкое улучшение возможностей ИИ. Несколько кусочков головоломки сложились синергетическим образом: интернет сгенерировал огромный объём данных, на котором можно учиться. Вычисления, особенно параллельные вычисления на графических процессорах сделали возможной обработку этих огромных наборов. Наконец, глубокие нейросети позволили воспользоваться преимуществами этих наборов и создать невероятно мощные модели МО.
И всё это означает, что некоторые вещи, бывшие ранее крайне сложными, теперь делать очень легко.
И что мы теперь можем делать? Распознавание образов
Возможно, глубочайшее (пардон за каламбур) и скорейшее влияние глубокое обучение оказало на область компьютерного зрения – в особенности, на распознавание объектов на фотографиях. Несколько лет назад этот комикс от xkcd прекрасно описывал передний край информатики:
Сегодня распознавание птиц и даже определённых видов птиц – тривиальная задача, которую может решить правильно мотивированный старшеклассник. Что поменялось?
Идею визуального распознавания объектов легко описать, но сложно реализовать: сложные объекты состоят из наборов более простых, которые в свою очередь состоят из более простых форм и линий. Лица состоят из глаз, носов и ртов, а те состоят из кружочков и линий, и так далее.
Поэтому распознавание лиц становится вопросом распознавания закономерностей, в которых расположены глаза и рты, что может потребовать распознавания форм глаза и рта из линий и кружочков.
Эти закономерности называются особенностями, и до появления глубокого обучения для распознавания было необходимо описать все особенности вручную и запрограммировать компьютер на их поиск. К примеру, есть знаменитый алгоритм распознавания лиц «метод Виолы — Джонса», основанный на том факте, что брови и нос обычно светлее глазниц, поэтому они формируют яркую Т-образную форму с двумя тёмными точками. Алгоритм, по сути, ищет подобные Т-образные формы.
Метод Виолы-Джонса работает хорошо и удивительно быстро, и служит основой распознавания лиц в дешёвых фотоаппаратах и т.п. Но, очевидно, не каждый объект, который вам нужно распознать, поддаётся подобному упрощению, и люди придумывали всё более сложные и низкоуровневые закономерности. Чтобы алгоритмы работали правильно, требовалась работа команды докторов наук, они были очень чувствительными и подверженными отказам.
Большой прорыв случился благодаря ГО, а в частности – определённому виду нейросетей под названием «свёрточные нейросети». Свёрточные нейросети, СНС – это глубокие сети с определённой структурой, вдохновлённой строением зрительной коры мозга млекопитающих. Такая структура позволяет СНС самостоятельно обучаться иерархии линий и закономерностей для распознавания объектов вместо того, чтобы ждать, пока доктора наук потратят годы на исследования того, какие из особенностей лучше подходят для этого. К примеру, СНС, обученная на лицах, выучит собственную внутреннюю репрезентацию линий и кружочков, складывающихся в глаза, уши и носы, и так далее.
Старые зрительные алгоритмы (метод Виолы-Джонса, слева) полагаются на вручную выделенных особенностях, а глубокие нейросети (справа) на собственную иерархию более сложных особенностей, составленных из более простых
СНС потрясающе хорошо подошли для компьютерного зрения, и вскоре исследователи смогли обучить их на выполнение всяческих задач по визуальному распознаванию, от поиска кошек на фото до определения пешеходов, попавших в камеру робомобиля.
Это всё замечательно, но есть и другая причина такого быстрого и широкого распространения СНС – это то, насколько легко они адаптируются. Помните восхождение на холм? Если наш старшеклассник захочет распознать определённую птицу, он может взять любую из множества зрительных сетей с открытым кодом, и обучить её на собственном наборе данных, даже не понимая, как работает лежащая в её основе математика.
Естественно, это можно расширить и ещё дальше.
Кто там? (распознавание лиц)
Допустим, вы хотите обучить сеть, распознающую не просто лица, но одно определённое лицо. Вы могли бы обучить сеть распознавать определённого человека, потом другого человека, и так далее. Однако на обучение сетей тратится время, и это значило бы, что для каждого нового человека требовалось бы переобучать сеть. Нет уж.
Вместо этого мы можем начать с сети, обученной распознавать лица в целом. Её нейроны настроены на распознавание всех лицевых структур: глаз, ушей, ртов, и так далее. Затем вы просто меняете выходные данные: вместо того, чтобы заставлять её распознавать определённые лица, вы командуете ей выдавать описание лица в виде сотен чисел, описывающих кривизну носа или форму глаз, и так далее. Сеть может делать это, поскольку уже «знает», из каких компонентов состоит лицо.
Вы, конечно, не определяете всё это напрямую. Вместо этого вы обучаете сеть, показывая ей набор лиц, а потом сравнивая выходные данные. Вы также обучаете её так, чтобы она давала схожие друг с другом описания одного и того же лица, и сильно отличающиеся друг от друга описания разных лиц. Математически говоря, вы обучаете сеть на построение соответствия изображениям лиц точки в пространстве особенностей, где картезианское расстояние между точками можно использовать для определения их схожести.
Изменение нейросети с распознавания лиц (слева) до описания лиц (справа) требует лишь изменения формата выходных данных, без смены её основы
Теперь можно распознавать лица, сравнивая описания каждого из лиц, создаваемые нейросетью
Обучив сеть, вы уже легко можете распознавать лица. Вы берёте изначальное лицо и получаете его описание. Затем берёте новое лицо и сравниваете описание, выдаваемое сетью, с вашим оригиналом. Если они находятся достаточно близко, вы говорите, что это одно и то же лицо. И вот вы перешли от сети, способной распознавать одно лицо, к тому, что можно использовать для распознавания любого лица!
Подобная структурная гибкость – ещё одна причина такой полезности глубоких нейросетей. Было разработано уже огромное количество разнообразных МО-моделей для компьютерного зрения, и хотя они развиваются в очень разных направлениях, базовая структура многих из них основана на таких ранних СНС, как Alexnet и Resnet.
Я даже слышал истории о людях, использующих визуальные нейросети для работы с данными временного ряда или измерениями датчиков. Вместо того, чтобы создавать специальную сеть для анализа потока данных, они обучали предназначенную для компьютерного зрения нейросеть с открытым кодом буквально смотреть на формы линий графиков.
Подобная гибкость – дело хорошее, но не бесконечное. Чтобы решать некоторые другие проблемы, требуется использовать другие типы сетей.
И даже до этой точки виртуальные ассистенты добирались очень долго
Что ты сказал? (Распознавание речи)
Каталогизация картинок и компьютерное зрение – не единственные области возрождения ИИ. Ещё одна область, в которой компьютеры продвинулись очень далеко – это распознавание речи, особенно в переводе речи в письменность.
Базовая идея в распознавании речи довольно похожа на принцип компьютерного зрения: распознавать сложные вещи в виде наборов более простых. В случае с речью распознавание предложений и фраз строится на распознавании слов, которое основано на распознавании слогов, или, если быть более точным, фонем. Так что, когда кто-то говорит «Bond, James Bond», на самом деле мы слышим BON+DUH+JAY+MMS+BON+DUH.
В зрении особенности организованы пространственно, и эту структуру обрабатывают СНС. В слухе эти особенности организованы во времени. Люди могут говорить быстро или медленно, без чёткого начала и конца речи. Нам нужна модель, способная воспринимать звуки по мере поступления, как человек, вместо того, чтобы ждать и выискивать в них законченные предложения. Мы не можем, как в физике, сказать, что пространство и время – это одно и то же.
Распознавать отдельные слоги довольно легко, однако их сложно изолировать. К примеру, «Hello there» может звучать похоже на «hell no they’re»… Так что для любой последовательности звуков обычно существует несколько комбинаций слогов, произнесённых на самом деле.
Чтобы во всём этом разобраться, нам нужна возможность изучать последовательность в определённом контексте. Если я слышу звук, то что более вероятно – что человек сказал «hello there dear» или «hell no they’re deer?» Здесь опять на помощь приходит машинное обучение. С достаточно большим набором образцов произнесённых слов можно выучить наиболее вероятные фразы. И чем больше примеров у вас есть, тем лучше это будет получаться.
Для этого люди используют рекуррентные нейросети, РНС. В большинстве типов нейросетей, как, например, в СНС, занимающихся компьютерным зрением, связи между нейронами работают в одном направлении, от входа к выходу (математически говоря, это направленные ациклические графы). В РНС выход нейронов может быть перенаправлен обратно на нейроны этого же уровня, на них самих или даже ещё дальше. Это позволяет РНС иметь свою память (если вам знакома двоичная логика, то эта ситуация похожа на работу триггеров).
СНС работает за один подход: скармливаем ей изображение, и она выдаёт какое-то описание. РНС поддерживает внутреннюю память о том, что ей давали раньше, и выдаёт ответы на основе того, что она уже видела, плюс того, что видит сейчас.
Такое свойство памяти у РНС позволяет им не только «слушать» слоги, поступающие к ней один за другим. Это позволяет сети обучаться тому, какие слоги идут вместе, формируя слово, и тому, насколько вероятны определённые их последовательности.
Используя РНС, возможно получить очень хорошую транскрипцию человеческой речи – до такой степени, что по некоторым измерениям точности транскрипций компьютеры сейчас могут превосходить людей. Конечно, звуки – не единственная область, где проявляются последовательности. Сегодня РНС используют также и для определения последовательностей движений для распознавания действий на видео.
Покажи мне, как ты умеешь двигаться (глубокие подделки и генеративные сети)
Пока что мы говорили о МО-моделях, предназначенных для распознавания: скажи мне, что изображено на картинке, скажи мне, что сказал человек. Но эти модели способны на большее – сегодняшние модели ГО можно использовать и для создания контента.
Это имеется в виду, когда люди рассказывают о deepfake – невероятно реалистичных поддельных видеороликах и изображениях, созданных с использованием ГО. Некоторое время назад один сотрудник немецкого телевидения вызвал обширную политическую дискуссию, создав поддельное видео, на котором министр финансов Греции показывал Германии средний палец. Для создания этого видео потребовалась команда редакторов, работавших для создания телепередачи, но в современном мире это может за несколько минут сделать любой человек с доступом к игровому компьютеру средней мощности.
Всё это довольно грустно, но не в этой области так мрачно – вверху показано моё любимое видео на тему этой технологии.
Эта команда создала модель, способная обработать видеоролик с танцевальными движениями одного человека и создать видео с другим человеком, повторяющим эти движения, волшебным образом выполняя их на уровне эксперта. Также интересно почитать сопутствующую этому научную работу.
Можно представить, что, используя все рассмотренные нами техники, возможно обучить сеть, получающую изображение танцора и сообщающую, где находятся его руки и ноги. А в таком случае, очевидно, на каком-то уровне сеть обучилась тому, как связывать пиксели в изображении с расположением конечностей человека. Учитывая то, что нейросеть – это просто данные, хранящиеся на компьютере, а не биологический мозг, должно быть возможно взять эти данные и пойти в обратную сторону – чтобы получить пиксели, соответствующие расположению конечностей.
Начните с сети, извлекающей позы из изображений людей
МО-модели, способные делать это, называются генеративными [англ. generate – порождать, производить, создавать / прим. перев.]. Все предыдущие рассмотренные нами модели называются дискриминационными [англ. discriminate – различать / прим. перев.]. Разницу между ними можно представить себе так: дискриминационная модель для кошек смотрит на фотографии и различает фото, содержащие кошек, и фото, где их нет. Генеративная модель создаёт изображения кошек на основе, допустим, описания того, какая это должна быть кошка.
Генеративные модели, «рисующие» изображения объектов, создаются при помощи тех же СНС-структур, что и модели, использующиеся для распознавания этих объектов. И эти модели можно обучать в основном так же, как и другие модели МО.
Однако хитрость заключается в том, чтобы придумать для их обучения «оценку». При обучении дискриминационной модели есть простой способ оценить правильность и неправильность ответа – типа, правильно ли сеть отличила собаку от кошки. Однако как оценить качество полученного рисунка кошки, или его точность?
И вот тут для человека, любящего теории заговоров и считающего, что мы все обречены, ситуация становится немного страшноватой. Видите ли, лучший из придуманных нами способов для обучения генеративных сетей заключается в том, чтобы не делать этого самостоятельно. Для этого мы просто используем другую нейросеть.
Эта технология называется генеративно-состязательная сеть, или ГСС. Вы заставляете две нейросети состязаться друг с другом: одна сеть пытается создавать подделки, к примеру, рисуя нового танцора на основе поз старого. Другая сеть обучена на поиск разницы между реальными и поддельными примерами с использованием кучи примеров реальных танцоров.
И две эти сети играют в состязательную игру. Отсюда и слово «состязательный» в названии. Генеративная сеть пытается делать убедительные подделки, а дискриминационная пытается понять, где подделка, а где реальная вещь.
В случае видеоролика с танцором в процессе обучения была создана отдельная дискриминационная сеть, выдававшая простые ответы да/нет. Она смотрела на изображение человека и на описание положения его конечностей, и решала, является ли изображение реальной фотографией или картинкой, нарисованной генеративной моделью.
ГСС заставляют две сети состязаться друг с другом: одна выдаёт «фейки», а другая пытается отличать фейк от оригинала
В итоговом рабочем процессе используется только генеративная модель, создающая нужные изображения
Во время повторяющихся раундов обучения модели становились всё лучше и лучше. Это похоже на состязание эксперта по ювелирным подделкам со специалистом по оценке – соревнуясь с сильным соперником, каждый из них становится сильнее и умнее. Наконец, когда работа моделей оказывается достаточно хорошей, можно взять генеративную модель и использовать её отдельно.
Генеративные модели после обучения могут оказаться очень полезными для создания контента. К примеру, они могут генерировать изображения лиц (которые можно использовать для обучения программ по распознаванию лиц), или фонов для видеоигр.
Чтобы всё это работало правильно, требуется большая работа по подстройкам и исправлениям, но по сути человек тут выступает в роли арбитра. Именно ИИ работают друг против друга, внося основные улучшения.
Так что, ждать ли нам в ближайшее время появления Skynet и Hal 9000?
В каждом документальном фильме о природе в конце есть эпизод, где авторы рассказывают о том, как вся эта грандиозная красота скоро исчезнет из-за того, насколько люди ужасны. Думаю, что в том же духе каждая ответственная дискуссия касательно ИИ должна включать раздел о его ограничениях и социальных последствиях.
Во-первых, давайте ещё раз подчеркнём текущие ограничения ИИ: главная мысль, которую вы, как я надеюсь, извлекли из прочтения этой статьи, состоит в том, что успех МО или ИИ чрезвычайно сильно зависит от выбранных нами моделей обучения. Если люди плохо организуют сеть или используют негодные материалы для обучения, то эти искажения могут оказаться весьма явными для всех.
Глубокие нейросети невероятно гибкие и мощные, но не имеют волшебных свойств. Несмотря на то, что вы используете глубокие нейросети для РНС и СНС, их структура сильно отличается, и поэтому всё равно определять её должны люди. Так что, даже если вы можете взять СНС для автомобилей, и переобучить её на распознавание птиц, вы не можете взять эту модель и переобучить её на распознавание речи.
Если описать это в человеческих терминах, то всё выглядит так, будто мы поняли, как работают зрительная кора и слуховая кора, однако понятия не имеем о том, как работает кора головного мозга, и откуда вообще можно начать к ней подступаться.
Это значит, что в ближайшее время мы, вероятно, не увидим голливудского богоподобного ИИ. Но это не значит, что в своём нынешнем виде ИИ не может оказать серьёзное влияние на социум.
Мы часто представляем себе, как ИИ «заменяет» нас, то есть, как роботы буквально делают нашу работу, но на самом деле это будет происходить не так. Взгляните, например, на рентгенологию: иногда люди, смотря на успехи компьютерного зрения, говорят о том, что ИИ заменит рентгенологов. Возможно, мы не дойдём до такой точки, когда у нас вообще не будет ни одного рентгенолога-человека. Но вполне возможно такое будущее, в котором на сотню сегодняшних рентгенологов ИИ позволит пяти-десяти из них делать работу всех остальных. Если такой сценарий реализуется, куда пойдут оставшиеся 90 врачей?
Даже если современное поколение ИИ не оправдает надежд наиболее оптимистичных его сторонников, он всё равно приведёт к весьма обширным последствиям. И эти проблемы нам придётся решать, поэтому неплохим началом, вероятно, будет овладеть основами этой области.
Полное оглавление для ИИ: современный подход
Глава 1 Введение … 1
Что такое ИИ? … 1
1.1.1 Действовать по-человечески: подход на основе теста Тьюринга … 2
1.1.2 Мыслить по-человечески: подход к когнитивному моделированию … 2
1.1.3 Рациональное мышление: «законы мышления» приближают … 3
1. 1.4 Действовать рационально: подход рационального агента … 3
1.1.5 Полезные машины … 4
1.2 Основы искусственного интеллекта … 5
1.2.1 Философия … 6
1.2.2 Математика … 8
1.2.3 Экономика … 9
1.2.4 Неврология … 11
1.2.5 Психология … 12
1.2.6 Вычислительная техника … 14
1.2.7 Теория управления и кибернетика … 15
1.2.8 Лингвистика … 16
1.3 История искусственного интеллекта … 17
1.3.1 Появление искусственного интеллекта (1943—1956) … 17
1.3.2 Ранний энтузиазм, большие надежды (1952–1969) … 18
1.3.3 Доза реальности (1966–1973) … 21
1.3.4 Экспертные системы (1969–1986) … 22
1.3.5 Возвращение нейронных сетей (с 1986 г. по настоящее время) … 24
1.3.6 Вероятностные рассуждения и машинное обучение (1987 – настоящее время) . .. 24
1.3.7 Большие данные (с 2001 г. по настоящее время) … 26
1.3.8 Глубокое обучение (с 2011 г. по настоящее время) … 26
1.4 Современное состояние … 27
1.5 Риски и преимущества ИИ … 31
Сводка … 34
Библиографические и исторические примечания … 35
Глава 2 Интеллектуальные агенты … 36
2.1 Агенты и среда… 36
2.2 Хорошее поведение: концепция рациональности … 39
2.2.1 Показатели эффективности … 39
2.2.2 Рациональность … 40
2.2.3 Всеведение, обучение и автономия … 40
2.3 Природа окружающей среды … 42
2.3.1 Указание среды задачи … 42
2.3.2 Свойства среды задач … 43
2.4 Структура агентов … 47
2.4.1 Агентские программы … 48
2.4.2 Простые рефлекторные агенты … 49
2. 4.3 Рефлекторные агенты на основе моделей … 51
2.4.4 Агенты на основе цели … 53
2.4.5 Утилитные агенты … 54
2.4.6 Обучающие агенты … 56
2.4.7 Как работают компоненты агентских программ … 58
Сводка … 60
Библиографические и исторические примечания … 60
Глава 3 Решение проблем с помощью поиска… 63
3.1 Агенты решения проблем … 63
3.1.1 Поиск проблем и решений … 65
3.1.2 Формулирование проблем … 66
3.2 Примеры проблем … 66
3.2.1 Стандартные проблемы … 66
3.2.2 Реальные проблемы … 69
3.3 Алгоритмы поиска … 71
3.3.1 Поиск по первому наилучшему … 73
3.3.2 Поиск структур данных … 73
3.3.3 Избыточные пути … 74
3.3.4 Измерение эффективности решения проблем … 75
3.4 Стратегии неинформированного поиска … 76
3.4.1 Поиск в ширину … 76
3.4.2 Алгоритм Дейкстры или поиск по единой стоимости … 77
3.4.3 Поиск в глубину и проблема памяти … 78
3.4.4 Поиск с ограниченной глубиной и итеративным углублением … 80
3.4.5 Двунаправленный поиск … 82
3.4.6 Сравнение алгоритмов неинформированного поиска … 84
3.5 Информированные (эвристические) стратегии поиска … 84
3.5.1 Жадный поиск наилучшего первого … 85
3.5.2 Поиск A* … 85
3.5.3 Контуры поиска … 89
3.5.4 Удовлетворительный поиск: недопустимая эвристика и взвешенная A* … 90
3.5.5 Поиск в памяти… 92
3.5.6 Двунаправленный эвристический поиск … 96
3.6 Эвристические функции … 97
3.6.1 Влияние эвристической точности на производительность . .. 98
3.6.2 Генерация эвристик из упрощенных задач … 99
3.6.3 Создание эвристик из подзадач: Базы данных шаблонов … 100
3.6.4 Создание эвристик с ориентирами … 102
3.6.5 Учимся лучше искать… 103
3.6.6 Изучение эвристики на основе опыта … 104
Сводка … 104
Библиографические и исторические примечания … 106
Глава 4 Поиск в сложных средах… 110
4.1 Проблемы локального поиска и оптимизации … 110
4.1.1 Поиск в гору … 111
4.1.2 Имитация отжига … 114
4.1.3 Локальный поиск луча … 115
4.1.4 Эволюционные алгоритмы … 115
4.2 Локальный поиск в непрерывных пробелах … 119
4.3 Поиск с недетерминированными действиями … 122
4.3.1 Беспорядочный вакуумный мир … 122
4.3.2 И—ИЛИ деревья поиска . .. 123
4.3.3 Попробуйте, попробуйте еще раз… 125
4.4 Поиск в частично наблюдаемой среде … 126
4.4.1 Поиск без наблюдения … 126
4.4.2 Поиск в частично наблюдаемой среде … 130
4.4.3 Решение частично наблюдаемых проблем … 132
4.4.4 Агент для частично наблюдаемых сред … 132
4.5 Агенты онлайн-поиска и неизвестные среды … 134
4.5.1 Проблемы с онлайн-поиском … 135
4.5.2 Агенты онлайн-поиска … 137
4.5.3 Локальный онлайн-поиск … 138
4.5.4 Обучение поиску в Интернете … 140
Сводка … 141
Библиографические и исторические примечания … 142
Глава 5 Состязательный поиск и игры… 146
5.1 Теория игр … 146
5.1.1 Игры с нулевой суммой для двух игроков … 147
5.2 Оптимальные решения в играх … 148
5. 2.1 Алгоритм минимаксного поиска … 149
5.2.2 Оптимальные решения в многопользовательских играх … 151
5.2.3 Альфа-бета-сокращение … 152
5.2.4 Порядок перемещения … 153
5.3 Эвристический альфа-бета-поиск по дереву … 156
5.3.1 Функции оценки … 156
5.3.2 Отключение поиска… 158
5.3.3 Прямая обрезка … 159
5.3.4 Поиск и поиск … 160
5.4 Поиск по дереву Монте-Карло … 161
5.5 Стохастические игры … 164
5.5.1 Функции оценки для азартных игр … 166
5.6 Частично наблюдаемые игры… 168
5.6.1 Кригшпиль: частично наблюдаемые шахматы … 168
5.6.2 Карточные игры … 171
5.7 Ограничения алгоритмов поиска игр … 173
Сводка … 174
Библиографические и исторические примечания … 175
Глава 6 Проблемы удовлетворения ограничений .
.. 180
6.1 Определение проблем удовлетворения ограничений … 180
6.1.1 Пример проблемы: Цвет карты … 181
6.1.2 Пример проблемы: планирование Job-shop … 182
6.1.3 Вариации формализма CSP … 183
6.2 Распространение ограничений: вывод в CSP … 185
6.2.1 Согласованность узлов … 186
6.2.2 Консистенция дуги … 186
6.2.3 Согласованность пути … 187
6.2.4 K консистенция … 188
6.2.5 Глобальные ограничения … 188
6.2.6 Судоку … 189
6.3 Поиск CSP с возвратом … 191
6.3.1 Сортировка переменных и значений … 193
6.3.2 Чередование поиска и логического вывода … 194
6.3.3 Интеллектуальный возврат: взгляд назад… 195
6.3.4 Обучение с ограничениями … 196
6.4 Локальный поиск CSP . .. 197
6.5 Структура задач … 199
6.5.1 Кондиционирование Cutset … 200
6.5.2 Декомпозиция дерева … 201
6.5.3 Симметрия значений … 203
Сводка … 203
Библиографические и исторические примечания … 204
Глава 7 Логические агенты… 208
7.1 Агенты, основанные на знаниях … 209
7.2 Мир Вампусов … 210
7.3 Логика … 214
7.4 Пропозициональная логика: очень простая логика … 217
7.4.1 Синтаксис … 217
7.4.2 Семантика … 218
7.4.3 Простая база знаний … 220
7.4.4 Простая процедура вывода … 220
7.5 Доказательство теоремы высказываний… 222
7.5.1 Вывод и доказательства … 223
7.5.2 Доказательство по разрешению … 225
Конъюнктивная нормальная форма … 226
Алгоритм разрешения . .. 227
Полнота разрешения … 228
7.5.3 Оговорки Хорна и определенные оговорки … 229
7.5.4 Прямая и обратная цепочка … 230
7.6 Проверка эффективной пропозициональной модели … 232
7.6.1 Полный алгоритм поиска с возвратом … 233
7.6.2 Алгоритмы локального поиска … 235
7.6.3 Ландшафт случайных проблем SAT … 236
7.7 Агенты, основанные на пропозициональной логике … 237
7.7.1 Текущее состояние мира… 237
7.7.2 Гибридный агент … 241
7.7.3 Оценка логического состояния … 241
7.7.4 Составление планов путем пропозиционального вывода … 244
Сводка … 246
Библиографические и исторические примечания … 247
Глава 8 Логика первого порядка … 251
8.1 Пересмотр представления … 251
8.1.1 Язык мысли . .. 252
8.1.2 Сочетание лучших формальных и естественных языков … 254
8.2 Синтаксис и семантика логики первого порядка … 256
8.2.1 Модели для логики первого порядка … 256
8.2.2 Символы и толкования … 257
8.2.3 Условия … 259
8.2.4 Атомарные предложения … 260
8.2.5 Сложные предложения … 260
8.2.6 Квантификаторы … 260
Универсальный количественный анализ (∀) … 260
Экзистенциальная квантификация (∃) … 262
Вложенные квантификаторы … 263
Соединения между ∀ и ∃ … 263
8.2.7 Равенство … 264
8.2.8 Семантика базы данных … 264
8.3 Использование логики первого порядка … 265
8.3.1 Утверждения и запросы в логике первого порядка … 265
8.3.2 Домен родства … 266
8.3.3 Числа, наборы и списки . .. 268
8.3.4 Мир вумпусов … 270
8.4 Инженерия знаний в логике первого порядка … 271
8.4.1 Процесс инженерии знаний … 272
8.4.2 Область электронных схем … 273
Определите вопросы… 273
Соберите соответствующие знания … 274
Выберите словарь… 274
Кодировать общие сведения о предметной области … 275
Кодировать экземпляр конкретной проблемы… 276
Запросы к процедуре вывода … 276
Отладка базы знаний… 277
Сводка … 277
Библиографические и исторические примечания … 278
Глава 9 Вывод в логике первого порядка … 280
9.1 Пропозициональный и вывод первого порядка… 280
9.1.1 Сведение к пропозициональному выводу … 281
9.2 Унификация и вывод первого порядка … 282
9. 2.1 Унификация … 283
9.2.2 Хранение и извлечение … 284
9.3 Прямая цепочка … 286
9.3.1 Определенные предложения первого порядка … 286
9.3.2 Простой алгоритм прямой цепочки … 287
9.3.3 Эффективная прямая цепочка … 289
Сопоставление правил с известными фактами … 289
Инкрементная прямая цепочка… 291
Факты, не относящиеся к делу… 292
9.4 Связывание в обратном направлении… 293
9.4.1 Алгоритм обратной цепочки … 293
9.4.2 Логическое программирование… 294
9.4.3 Избыточный вывод и бесконечные циклы … 295
9.4.4 Семантика базы данных Пролога … 297
9.4.5 Программирование логики с ограничениями … 298
9.5 Разрешение … 298
9.5.1 Конъюнктивная нормальная форма для логики первого порядка … 299
9. 5.2 Правило вывода разрешения … 300
9.5.3 Примеры доказательств … 301
9.5.4 Полнота разрешения … 303
9.5.5 Равенство … 306
9.5.6 Стратегии разрешения … 308
Практическое использование средств доказательства резольвентной теоремы … 309
Сводка … 309
Библиографические и исторические примечания … 310
Глава 10 Представление знаний … 314
10.1 Онтологическая инженерия … 314
10.2 Категории и объекты … 317
10.2.1 Физический состав … 318
10.2.2 Измерения … 319
10.2.3 Объекты: Вещи и прочее … 321
10.3 События … 322
10.3.1 Время … 324
10.3.2 Свободные и предметы … 325
10.4 Ментальные объекты и модальная логика … 326
10.4.1 Другая модальная логика … 328
10. 5 Системы рассуждений для категорий … 329
10.5.1 Семантические сети … 329
10.5.2 Описание логики … 331
10.6 Обоснование информации по умолчанию … 333
10.6.1 Ограничение и логика по умолчанию … 333
10.6.2 Системы поддержания достоверности … 335
Сводка … 337
Библиографические и исторические примечания … 338
Глава 11 Автоматизированное планирование… 344
11.1 Определение классического планирования … 344
11.1.1 Пример домена: Грузовые авиаперевозки … 345
11.1.2 Пример домена: проблема с запасным колесом … 346
11.1.3 Пример домена: Мир блоков … 346
11.2 Алгоритмы классического планирования … 348
11.2.1 Прямой поиск в пространстве состояний для планирования … 348
11.2.2 Поиск в обратном направлении для планирования . .. 350
11.2.3 Планирование как логическая выполнимость … 351
11.2.4 Другие классические подходы к планированию … 352
11.3 Эвристика для планирования … 353
11.3.1 Независимая от домена обрезка … 354
11.3.2 Абстракция состояния в планировании … 355
11.4 Иерархическое планирование … 356
11.4.1 Действия высокого уровня … 357
11.4.2 Поиск примитивных решений … 358
11.4.3 Поиск абстрактных решений … 360
11.5 Планирование и действия в недетерминированных областях … 365
11.5.1 Планирование без датчиков … 367
11.5.2 Планирование на случай непредвиденных обстоятельств… 370
11.5.3 Онлайн-планирование … 371
11.6 Время, расписания и ресурсы … 374
11.6.1 Представление временных и ресурсных ограничений … 375
11.6.2 Решение проблем планирования . .. 376
11.7 Анализ подходов к планированию … 378
Сводка … 379
Библиографические и исторические примечания … 380
Глава 12 Количественная оценка неопределенности … 385
12.1 Действия в условиях неопределенности … 385
12.1.1 Обобщая неопределенность … 386
12.1.2 Неопределенность и рациональные решения … 387
12.2 Основные обозначения вероятности … 388
12.2.1 Что такое вероятности… 388
12.2.2 Язык предложений в вероятностных утверждениях … 390
12.2.3 Аксиомы вероятности и их обоснованность … 393
12.3 Вывод с использованием полных совместных распределений … 395
12.4 Независимость … 397
12.5 Правило Байеса и его использование … 399
12.5.1 Применение правила Байеса: простой случай … 399
12.5.2 Использование правила Байеса: объединение доказательств . .. 400
12.6 Наивные байесовские модели … 402
12.6.1 Текстовая классификация с наивным байесовским подходом … 403
12.7 Возвращение в мир вампусов … 404
Сводка … 407
Библиографические и исторические примечания … 408
Глава 13 Вероятностное рассуждение… 412
13.1 Представление знаний в неопределенной области … 412
13.2 Семантика байесовских сетей … 414
Метод построения байесовских сетей … 415
Компактность и порядок узлов … 417
13.2.1 Отношения условной независимости в байесовских сетях … 418
13.2.2 Эффективное представление условных распределений … 420
13.2.3 Байесовские сети с непрерывными переменными … 422
13.2.4 Пример из практики: страхование автомобиля … 424
13.3 Точный вывод в байесовских сетях … 427
13. 3.1 Вывод по перечислению … 427
13.3.2 Алгоритм устранения переменных … 430
Операции над факторами … 431
Порядок и релевантность переменных … 432
13.3.3 Сложность точного вывода … 433
13.3.4 Алгоритмы кластеризации … 434
13.4 Приблизительный вывод для байесовских сетей … 435
13.4.1 Методы прямого отбора проб … 436
Отклонение выборки в байесовских сетях … 437
Выборка по важности … 439
13.4.2 Вывод с помощью моделирования цепи Маркова … 441
Выборка Гиббса в байесовских сетях … 442
Анализ цепей Маркова … 443
Почему выборка Гиббса работает … 445
Сложность выборки Гиббса … 446
Метрополис — отбор проб Гастингса … 447
13.4.3 Компиляция приблизительного вывода … 448
13. 5 Каузальные сети … 449
13.5.1 Представление действий: do -operator … 451
13.5.2 Критерий черного хода … 453
Сводка … 453
Библиографические и исторические примечания … 454
Глава 14 Вероятностные рассуждения во времени… 461
14.1 Время и неопределенность … 461
14.1.1 Состояния и наблюдения … 462
14.1.2 Модели переходов и датчиков … 463
14.2 Вывод во временных моделях … 465
14.2.1 Фильтрация и предсказание … 466
14.2.2 Сглаживание … 468
14.2.3 Нахождение наиболее вероятной последовательности … 471
14.3 Скрытые марковские модели … 473
14.3.1 Упрощенные матричные алгоритмы … 474
14.3.2 Пример скрытой марковской модели: локализация … 476
14.4 Фильтры Калмана … 479
14.4. 1 Обновление распределения Гаусса … 479
14.4.2 Простой одномерный пример… 480
14.4.3 Общий случай … 482
14.4.4 Применимость фильтрации Калмана … 483
14,5 Динамические байесовские сети … 485
14.5.1 Построение DBN … 486
14.5.2 Точный вывод в DBN … 489
14.5.3 Приблизительный вывод в DBN … 491
Сводка … 496
Библиографические и исторические примечания … 497
Глава 15 Вероятностное программирование… 500
15.1 Реляционные вероятностные модели … 501
15.1.1 Синтаксис и семантика … 502
15.1.2 Пример: Рейтинг уровней навыков игрока … 505
15.1.3 Вывод в реляционных вероятностных моделях … 506
15.2 Вероятностные модели открытой вселенной … 507
15.2.1 Синтаксис и семантика … 508
15.2. 2 Вывод в вероятностных моделях открытой вселенной … 510
15.2.3 Примеры … 511
Сопоставление цитирования … 511
Наблюдение за ядерным соглашением … 512
15.3 Отслеживание сложного мира … 514
15.3.1 Пример: многоцелевое отслеживание… 515
15.3.2 Пример: мониторинг трафика … 518
15.4 Программы как вероятностные модели … 519
15.4.1 Пример: Чтение текста … 519
15.4.2 Синтаксис и семантика … 520
15.4.3 Результаты вывода … 522
15.4.4 Улучшение генеративной программы для включения марковской модели … 522
15.4.5 Вывод в генеративных программах … 522
Сводка … 523
Библиографические и исторические примечания … 524
Глава 16 Принятие простых решений… 528
16.1 Сочетание убеждений и желаний в условиях неопределенности . .. 528
16.2 Основы теории полезности … 529
16.2.1 Ограничения на рациональные предпочтения … 530
16.2.2 Рациональные предпочтения ведут к полезности … 531
16.3 Вспомогательные функции … 532
16.3.1 Оценка полезности и шкалы полезности … 533
16.3.2 Полезность денег … 534
16.3.3 Ожидаемая полезность и разочарование после принятия решения … 536
16.3.4 Человеческое суждение и иррациональность … 538
16.4 Многоатрибутные служебные функции … 540
16.4.1 Доминирование … 540
16.4.2 Структура предпочтений и многоатрибутная утилита … 543
Предпочтения без неопределенности … 543
Предпочтения с неопределенностью … 544
16.5 Сети принятия решений … 544
16.5.1 Представление проблемы принятия решения с помощью сети принятия решений … 545
16. 5.2 Оценка сетей принятия решений … 546
16.6 Ценность информации … 547
16.6.1 Простой пример… 547
16.6.2 Общая формула полной информации … 548
16.6.3 Свойства значения информации … 549
16.6.4 Реализация агента по сбору информации … 550
16.6.5 Сбор информации без близорукости … 551
16.6.6 Анализ чувствительности и надежные решения … 552
16.7 Неизвестные настройки … 553
16.7.1 Неуверенность в собственных предпочтениях … 553
16.7.2 Уважение к людям … 554
Сводка … 557
Библиографические и исторические примечания … 557
Глава 17 Принятие сложных решений… 562
17.1 Задачи последовательного принятия решений … 562
17.1.1 Коммунальные услуги с течением времени … 564
17.1.2 Оптимальные политики и утилиты состояний . .. 567
17.1.3 Шкала вознаграждения … 569
17.1.4 Представление MDP … 570
17.2 Алгоритмы для MDP … 572
17.2.1 Итерация значения … 572
Сходимость итерации значения … 574
17.2.2 Итерация политики … 576
17.2.3 Линейное программирование … 578
17.2.4 Онлайн-алгоритмы для MDP … 578
17.3 Проблемы с бандитами … 581
17.3.1 Вычисление индекса Гиттинса … 583
17.3.2 Бандит Бернулли … 584
17.3.3 Приблизительно оптимальная бандитская политика … 585
17.3.4 Неиндексируемые варианты … 586
17.4 Частично наблюдаемые MDP … 588
17.4.1 Определение POMDP … 588
17.5 Алгоритмы решения POMDP … 590
17.5.1 Итерация значения для POMDP … 590
17.5.2 Онлайн-алгоритмы для POMDP … 593
Сводка . .. 595
Библиографические и исторические примечания … 596
Глава 18 Многоагентное принятие решений… 599
18.1 Свойства мультиагентных сред … 599
18.1.1 Одно лицо, принимающее решения … 599
18.1.2 Несколько лиц, принимающих решения … 600
18.1.3 Многоагентное планирование … 601
18.1.4 Планирование с несколькими агентами: сотрудничество и координация … 604
18.2 Некооперативная теория игр … 605
18.2.1 Игры с одним ходом: игры в нормальной форме … 605
18.2.2 Социальное обеспечение … 609
Вычисление равновесия … 610
18.2.3 Повторные игры … 614
18.2.4 Последовательные игры: расширенная форма … 617
Случайные и одновременные ходы … 619
Получение неполной информации… 619
18.2.5 Неопределенные выплаты и вспомогательные игры . .. 623
18.3 Кооперативная теория игр … 626
18.3.1 Коалиционные структуры и результаты … 626
18.3.2 Стратегия в совместных играх … 627
18.3.3 Вычисления в совместных играх … 630
Маржинальные нетто-отчисления … 630
Коалиционные структуры для максимального социального благосостояния … 631
18.4 Принятие коллективных решений … 632
18.4.1 Распределение задач с сетью контрактов … 632
18.4.2 Распределение дефицитных ресурсов с помощью аукционов … 634
Общедоступные товары … 637
18.4.3 Голосование … 638
Стратегическая манипуляция … 641
18.4.4 Торг… 641
Торг с протоколом чередующихся предложений … 641
Нетерпеливые агенты… 642
Согласование в предметно-ориентированных доменах … 643
Протокол монотонной уступки . .. 644
Стратегия Цойтена … 644
Сводка … 645
Библиографические и исторические примечания … 646
Глава 19 Обучение на примерах… 651
19.1 Формы обучения … 651
19.2 Обучение с учителем… 653
19.2.1 Пример проблемы: ресторан ждет … 656
19.3 Изучение деревьев принятия решений … 657
19.3.1 Выразительность деревьев решений … 657
19.3.2 Изучение деревьев решений на примерах … 658
19.3.3 Выбор тестов атрибутов … 661
19.3.4 Обобщение и переобучение … 663
19.3.5 Расширение применимости деревьев решений … 664
19.4 Выбор и оптимизация модели … 665
19.4.1 Выбор модели … 667
19.4.2 От частоты ошибок к потерям … 669
19.4.3 Регуляризация … 671
19.4.4 Настройка гиперпараметров . .. 671
19.5 Теория обучения … 672
19.5.1 Пример обучения PAC: изучение списков решений … 674
19.6 Линейная регрессия и классификация … 676
19.6.1 Одномерная линейная регрессия … 676
19.6.2 Градиентный спуск … 677
19.6.3 Многомерная линейная регрессия … 679
19.6.4 Линейные классификаторы с жестким порогом … 682
19.6.5 Линейная классификация с логистической регрессией … 684
19.7 Непараметрические модели … 686
19.7.1 Модели ближайшего соседа … 687
19.7.2 Поиск ближайших соседей с k -d деревьями … 688
19.7.3 Хеширование с учетом местоположения … 689
19.7.4 Непараметрическая регрессия … 691
19.7.5 Машины опорных векторов … 692
19.7.6 Трюк ядра … 695
19.8 Обучение ансамблю … 696
19.8.1 Упаковка . .. 697
19.8.2 Случайные леса … 697
19.8.3 Стекирование … 699
19.8.4 Повышение… 699
19.8.5 Усиление градиента … 701
19.8.6 Онлайн-обучение … 702
19.9 Разработка систем машинного обучения … 704
19.9.1 Формулировка проблемы … 704
19.9.2 Сбор, оценка и управление данными … 705
Разработка функций … 707
Исследовательский анализ и визуализация данных … 708
19.9.3 Выбор модели и обучение … 709
19.9.4 Доверие, интерпретируемость и объяснимость … 710
19.9.5 Эксплуатация, контроль и техническое обслуживание … 712
Сводка … 714
Библиографические и исторические примечания … 715
Глава 20 Изучение вероятностных моделей… 721
20.1 Статистическое обучение … 721
20.2 Обучение с использованием полных данных . .. 724
20.2.1 Обучение параметра максимального правдоподобия: дискретные модели … 725
20.2.2 Наивные байесовские модели … 727
20.2.3 Генеративные и дискриминативные модели … 727
20.2.4 Обучение параметра максимального правдоподобия: непрерывные модели … 728
20.2.5 Байесовский параметр обучения … 730
20.2.6 Байесовская линейная регрессия … 732
20.2.7 Изучение структур байесовской сети … 734
20.2.8 Оценка плотности с помощью непараметрических моделей … 736
20.3 Обучение со скрытыми переменными: алгоритм EM … 737
20.3.1 Неконтролируемая кластеризация: обучающие смеси гауссианов … 738
20.3.2 Изучение значений параметров байесовской сети для скрытых переменных … 741
20.3.3 Изучение скрытых марковских моделей … 744
20.3.4 Общая форма алгоритма EM … 744
20. 3.5 Изучение структур байесовской сети со скрытыми переменными … 745
Сводка … 746
Библиографические и исторические примечания … 747
Глава 21 Глубокое обучение… 750
21.1 Простые сети прямой связи … 751
21.1.1 Сети как сложные функции … 751
21.1.2 Градиенты и обучение … 754
21.2 Вычислительные графики для глубокого обучения … 756
21.2.1 Кодировка ввода … 756
21.2.2 Выходные слои и функции потерь … 757
21.2.3 Скрытые слои … 759
21.3 Сверточные сети … 760
21.3.1 Объединение и субдискретизация … 762
21.3.2 Тензорные операции в CNN … 763
21.3.3 Остаточные сети … 764
21.4 Алгоритмы обучения … 765
21.4.1 Вычисление градиентов в графах вычислений … 766
21.4.2 Пакетная нормализация . .. 768
21.5 Обобщение … 768
21.5.1 Выбор сетевой архитектуры … 768
21.5.2 Поиск нейронной архитектуры … 770
21.5.3 Распад веса … 771
21.5.4 Отсев … 772
21.6 Рекуррентные нейронные сети … 772
21.6.1 Обучение базовой RNN … 773
21.6.2 Длинные краткосрочные RNN памяти … 775
21.7 Обучение без учителя и трансферное обучение … 775
21.7.1 Обучение без учителя … 776
Вероятностный PCA: простая генеративная модель … 776
Автоэнкодеры … 778
Модели глубокой авторегрессии … 779
Генеративно-состязательные сети … 780
Неконтролируемый перевод … 780
21.7.2 Перенос обучения и многозадачное обучение … 781
21.8 Приложения … 782
21.8.1 Видение … 782
21.8.2 Обработка естественного языка . .. 783
21.8.3 Обучение с подкреплением… 783
Сводка … 784
Библиографические и исторические примечания … 785
Глава 22 Обучение с подкреплением… 789
22.1 Учимся на вознаграждениях… 789
22.2 Пассивное обучение с подкреплением … 791
22.2.1 Прямая оценка полезности … 792
22.2.2 Адаптивное динамическое программирование … 793
22.2.3 Временно-разностное обучение … 793
22.3 Активное обучение с подкреплением … 797
22.3.1 Исследование … 797
22.3.2 Безопасное исследование… 799
22.3.3 Временная разница Q-обучение … 801
22.4 Обобщение в обучении с подкреплением… 803
22.4.1 Аппроксимация прямой оценки полезности … 804
22.4.2 Аппроксимация обучения временной разности … 805
22.4.3 Глубокое обучение с подкреплением . .. 806
22.4.4 Формирование вознаграждения … 807
22.4.5 Иерархическое обучение с подкреплением … 807
22.5 Поиск политики … 810
22.6 Ученичество и обучение с обратным подкреплением … 812
22.7 Применения обучения с подкреплением … 815
22.7.1 Применения в играх … 815
22.7.2 Применение к управлению роботом… 816
Сводка … 818
Библиографические и исторические примечания … 819
Глава 23 Обработка естественного языка … 823
23.1 Языковые модели … 823
23.1.1 Модель набора слов … 824
23.1.2 Модели N-граммных слов … 826
23.1.3 Другие модели N-грамм … 826
23.1.4 Сглаживание моделей n-грамм … 827
23.1.5 Представление слов … 828
23.1.6 Тегирование части речи (POS) … 829
23.1.7 Сравнение языковых моделей . .. 832
23.2 Грамматика … 833
23.2.1 Словарь E 0 … 835
23.3 Анализ … 835
23.3.1 Синтаксический анализ зависимостей … 838
23.3.2 Изучение синтаксического анализатора на примерах … 839
23.4 Дополненная грамматика … 841
23.4.1 Семантическая интерпретация … 843
23.4.2 Изучение семантических грамматик … 845
23.5 Осложнения реального естественного языка … 845
23.6 Задания на естественном языке … 849
Сводка … 850
Библиографические и исторические примечания … 851
Глава 24 Глубокое обучение для обработки естественного языка… 856
24.1 Вложения слов … 856
24.2 Рекуррентные нейронные сети для НЛП … 860
24.2.1 Языковые модели с рекуррентными нейронными сетями … 860
24.2.2 Классификация с помощью рекуррентных нейронных сетей . .. 862
24.2.3 LSTM для задач НЛП … 863
24.3 Последовательные модели … 864
24.3.1 Внимание… 865
24.3.2 Расшифровка … 867
24.4 Архитектура трансформатора … 868
24.4.1 Самовнимание … 868
24.4.2 От самоконтроля до трансформатора… 869
24.5 Предварительное обучение и трансферное обучение … 871
24.5.1 Предварительно обученные вложения слов … 871
24.5.2 Предварительно обученные контекстные представления … 873
24.5.3 Маскированные языковые модели … 873
24.6 Современный уровень техники … 875
Сводка … 878
Библиографические и исторические примечания … 878
Глава 25 Компьютерное зрение… 881
25.1 Введение … 881
25.2 Формирование изображения … 882
25.2.1 Изображения без линз: камера-обскура . .. 882
25.2.2 Системы линз … 884
25.2.3 Масштабированная орфографическая проекция … 885
25.2.4 Свет и затенение … 886
25.2.5 Цвет … 888
25.3 Простые функции изображения … 888
25.3.1 Ребра … 889
25.3.2 Текстура … 892
25.3.3 Оптический поток … 893
25.3.4 Сегментация естественных изображений … 894
25.4 Классификация изображений … 895
25.4.1 Классификация изображений с помощью сверточных нейронных сетей … 896
25.4.2 Почему сверточные нейронные сети хорошо классифицируют изображения … 897
25.5 Обнаружение объектов … 899
25.6 Трехмерный мир … 901
25.6.1 3D-сигналы из нескольких представлений … 901
25.6.2 Бинокулярный стереопсис … 902
25.6.3 3D-сигналы от движущейся камеры … 904
25. 6.4 3D-подсказки с одного вида … 905
25.7 Использование компьютерного зрения … 906
25.7.1 Понимание того, что делают люди … 906
25.7.2 Связывание изображений и слов … 909
25.7.3 Реконструкция с разных точек зрения … 911
25.7.4 Геометрия с одного вида … 911
25.7.5 Изготовление изображений … 913
25.7.6 Управление движением с помощью зрения … 917
Сводка … 919
Библиографические и исторические примечания … 920
Глава 26 Робототехника … 925
26.1 Роботы … 925
26.2 Оборудование робота … 926
26.2.1 Типы роботов с точки зрения аппаратного обеспечения … 926
26.2.2 Чувствовать мир… 927
26.2.3 Создание движения … 929
26.3 Какую проблему решает робототехника? … 930
26.4 Роботизированное восприятие . .. 931
26.4.1 Локализация и отображение … 932
26.4.2 Другие типы восприятия … 935
26.4.3 Контролируемое и неконтролируемое обучение в восприятии роботов … 937
26.5 Планирование и контроль … 938
26.5.1 Пространство конфигурации … 939
26.5.2 Планирование движения … 942
Графики видимости … 943
Диаграммы Вороного … 943
Разложение клеток … 945
Рандомизированное планирование движения … 946
Быстрое изучение случайных деревьев… 947
Оптимизация траектории для кинематического планирования … 948
26.5.3 Управление отслеживанием траектории … 950
Планы и политики … 954
26.5.4 Оптимальное управление … 954
26.6 Планирование неопределенных движений … 956
26.7 Обучение с подкреплением в робототехнике . .. 958
26.7.1 Использование моделей … 959
26.7.2 Использование другой информации … 960
26.8 Люди и роботы … 961
26.8.1 Координация … 961
Люди как примерно рациональные агенты … 961
Предсказание действий человека … 962
Предсказания человека о роботе… 964
Люди как агенты черного ящика … 965
26.8.2 Научиться делать то, что хотят люди… 965
Предпочтительное обучение: функции стоимости обучения … 965
Политики обучения напрямую через имитацию … 966
26.9 Альтернативные робототехнические платформы … 968
26.9.1 Реактивные контроллеры … 968
26.9.2 Архитектуры подчинения … 969
26.10 Домены приложений … 971
Сводка … 974
Библиографические и исторические примечания … 975
Глава 27 Философия, этика и безопасность ИИ .
.. 981
27.1 Пределы ИИ … 981
27.1.1 Аргумент от неформальности … 981
27.1.2 Аргумент от инвалидности … 982
27.1.3 Математическое возражение … 983
27.1.4 Измерение ИИ … 984
27.2 Могут ли машины действительно думать? … 984
27.2.1 Китайская комната … 985
27.2.2 Сознание и качество … 985
27.3 Этика ИИ … 986
27.3.1 Летальное автономное оружие … 987
27.3.2 Наблюдение, безопасность и конфиденциальность … 990
27.3.3 Справедливость и предвзятость … 992
27.3.4 Доверие и прозрачность … 996
27.3.5 Будущее работы … 998
27.3.6 Права робота … 1000
27.3.7 Безопасность ИИ … 1001
Сводка … 1005
Библиографические и исторические примечания … 1006
Глава 28 Будущее ИИ.
.. 1012
28.1 Компоненты ИИ … 1012
Датчики и приводы … 1012
Представление состояния мира… 1013
Выбор действий… 1014
Решаем, чего мы хотим… 1014
Обучение… 1015
Ресурсы … 1017
28.2 Архитектуры ИИ … 1018
Общий ИИ … 1020
Инженерный ИИ … 1021
Будущее… 1022
Приложение A: Математические основы… 1023
A.1 Анализ сложности и нотация O() … 1023
A.1.1 Асимптотический анализ … 1023
A.1.2 NP и изначально сложные проблемы … 1024
A.2 Вектора, матрицы и линейная алгебра … 1025
A.3 Распределения вероятностей … 1027
Библиографические и исторические примечания … 1029
Приложение B: Примечания по языкам и алгоритмам.
.. 1030
B.1 Определение языков с помощью формы Бэкуса—Наура (BNF) … 1030
B.2 Описание алгоритмов с помощью псевдокода … 1031
B.3 Дополнительный онлайн-материал … 1032
Библиография … 1033
Алфавитный указатель … 1089
Традиционный ИИ против современного ИИ. Эволюция искусственного… | by Awais Bajwa
источник Shutterstock.com
Сегодняшний AI
Вне всякого сомнения, самым модным сегодня словом является искусственный интеллект или ИИ. Самые известные исследовательские организации, в том числе Gartner, McKinsey и PWC, прославили будущее ИИ с помощью умопомрачительных статистических данных и прогнозов на будущее. Вот отчет PWC (2018 г.), в котором прогнозируется, что к 2030 г. ИИ внесет в мировую экономику 15,7 трлн долларов. Общая производительность и ВВП увеличатся на 55% и 14% соответственно. Указ, подписанный президентом США Дональдом Дж. Трампом, может быстро продемонстрировать важность ИИ в Соединенных Штатах.
источник
«Вместе мы можем использовать самые инновационные технологии в мире, чтобы наше правительство лучше работало на благо американского народа».
Майкл Крациос
Технический директор США ( источник )
В нашей повседневной жизни есть несколько примеров, когда мы используем искусственный интеллект, даже не замечая этого. Это включает в себя карты Google, интеллектуальные ответы в Gmail (2018+), пометку изображений в Facebook (примерно 2015 г.), видеорекомендации youtube/NetFlix (2016+) и т. д. как этот (2019), где Новак Джокович использовал ИИ в финале Уимблдона, или посмотрите на этот веб-сайт (запущенный в 2019 году) со 100% поддельными фотографиями людей, которые выглядят на 100% реальными, используя глубокие нейронные сети (глубокое обучение). Этот список можно продолжать и продолжать.
Традиционный ИИ (1950–2008)
Термин «искусственный интеллект» был придуман в 1956 году на исторической конференции в Дартмуте. На этом раннем этапе развития ИИ ученые и шумиха в СМИ делали утопические заявления о возможностях прорывов ИИ. Некоторые ученые ясно дали понять, что в ближайшие 20 лет машина будет делать все, что могут делать люди.
«Машины будут способны выполнять любую работу, которую может выполнять человек».
1965 — Герберт А. Саймон
70 лет истории ИИ Авайс Баджва
С тех пор в эволюции ИИ было много взлетов и падений. В 1973 году британское правительство опубликовало отчет под названием «Отчет Лайтхилла» после расследования и конфисковало финансирование многих крупных исследовательских университетов ИИ. Известными подходами к ИИ в то время были экспертные системы и нечеткая логика, а Пролог и Лисп были лучшими языками программирования среди C/C++. Первый значительный прорыв в экспертных системах произошел в 80-х годах, когда была представлена первая выдающаяся экспертная система SID. Позже были и другие неудачи в области искусственного интеллекта, за которыми последовал еще один прорыв IBM, когда ее суперкомпьютер Deep Blue победил чемпиона мира Гарри Каспарова в Нью-Йорке в 1919 году. 97. Поскольку в те дни концепция ИИ считалась неудачной, IBM заявила, что не использует ИИ в Deep Blue, что стало причиной некоторых интересных дискуссий.
Обратите внимание, что все прорывы произошли за последние 8–10 лет. Алгоритм обратного распространения, лежащий в основе глубокого обучения/нейронных сетей, был впервые представлен в 1986 году. Возникает вопрос: « Почему в последние 8–10 лет (то есть в 2009–2019 годах), когда ИИ существует уже более 70 лет? ».
908:31 Чтобы получить ответ, давайте перенесемся в текущую эпоху «Современного ИИ».
Современный ИИ (2008+)
Термин «наука о данных» был придуман в начале 2008 года двумя руководителями группы данных из Linkedin и Facebook. (Диджей Патель и Джефф Хаммербахер). Эта новая область компьютерных наук представила расширенную аналитику, в которой использовались статистика, вероятность, линейная алгебра и многовариантное исчисление. Позже, в конце 2012 года, настоящий прорыв произошел в области искусственного интеллекта, когда в историческом конкурсе ImageNet заявка на основе CNN под названием AlexNet превзошла всех других конкурентов и получила на 10,8% более низкую частоту ошибок, чем занявшая второе место. Это было появлением современного ИИ, и считается, что оно послужило толчком к новому буму в мире ИИ. Одной из основных причин победы было использование графического процессора (GPU) для обучения архитектуры нейронной сети. Позже, в 2015 году, лидер Facebook по искусственному интеллекту Янн ЛеКун активно продвигал глубокое обучение и его возможности вместе с другими «крестными отцами искусственного интеллекта». Сегодня несколько поставщиков облачных услуг предлагают облачные графические процессоры для «современного искусственного интеллекта», тогда как их внедрение никогда не рассматривалось ранее.
Графический процессор буквально изменил игру, переключившись с ЦП на ГП. Он произвел революцию в технологиях и дал новое определение вычислительной мощности и параллельной обработке. ИИ требует высокоскоростной вычислительной мощности из-за передовых математических вычислений. Тем более, что объем данных, генерируемых за последние десять лет, увеличился в геометрической прогрессии (источник).
Следовательно, исследования ИИ во всем мире росли экспоненциально, на момент написания этой статьи объем исследовательских работ по ИИ составляет около 100/день .
Следовательно, у нас есть ответ на наш предыдущий вопрос:
« Почему в последние 8–10 лет (то есть в 2009–2019 годах), когда ИИ существует уже более 70 лет? ».
Ответ: Огромный рост данных, более быстрая и дешевая обработка «GPU» и быстро развивающиеся исследования в области искусственного интеллекта.
источник
Будущая волна искусственного интеллекта
Компания Google достаточно любезна, чтобы позволить сотрудникам посвящать 20% времени своим амбициям и интересным проектам. В 2015 году член группы поисковых фильтров Google Александр Мордвинцев в качестве хобби разработал программу нейронной сети, которая поразила его коллег галлюциногенными образами, похожими на сны. И этот проект был назван Google как Deep Dream. Этот проект стал результатом экспериментов при обучении нейронной сети и игре с функциями активации в масштабе. Но даже сегодня одна из самых больших загадок ИИ заключается в том, что у нас нет реального понимания того, насколько точно ИИ принимает свои внутренние решения или как нейронные сети учится учиться в обратном порядке. С точки зрения непрофессионала, фактическое обоснование ИИ или предвзятость в отношении принятия решения — загадка, и это называется «черным ящиком ИИ».
XAI
Одна из новых волн усилий искусственного интеллекта состоит в том, чтобы сломать этот черный ящик и получить логическое объяснение процессов принятия решений. Эта новая концепция теперь называется « объяснимый искусственный интеллект » или XAI. Как только XAI будет достигнут, сообщество ИИ получит доступ к новой волне ИИ. Появятся более надежные и устойчивые структуры ИИ, включая предсказуемое понимание процессов ИИ и моделей будущего роста.
Малые данные
Крупные прорывы в области искусственного интеллекта происходят в области глубокого обучения, а в глубоком обучении нейронные сети очень нуждаются в огромном количестве данных. Например, чтобы научить модель распознавать кошку, необходимо передать примерно 100 тысяч изображений кошек/не кошек, чтобы получить идеальную классификацию кошки, примерно равную человеческому глазу. Другая область исследований, которая набирает обороты в геометрической прогрессии, — это быстрое обучение с использованием меньшего количества наборов данных и использование вероятностных структур. Эта новая концепция называется «Малые данные». Область исследования: «Как обучать модели машинного обучения на меньшем количестве данных и получать точные прогнозы». Это огромная возможность в области искусственного интеллекта, и ожидается, что она взорвется с будущими перспективами для инноваций.
Две другие области будущих исследований ИИ — добиться значительных успехов в области «обучения без учителя» и « обучения с подкреплением». Где мы можем использовать имеющиеся знания с помощью трансферного обучения и создания искусственно созданных выборочных данных с некоторым обучением с подкреплением, например, с помощью сетевых моделей GAN.
Основные выводы
Теоретически традиционному ИИ уже 70 лет, но за последние 8–10 лет он значительно набрал обороты (современный ИИ). Эти прорывы в области современного ИИ способствовали экспоненциальному росту объема данных, быстрым исследованиям и дешевой вычислительной мощности с моделями «оплата по мере использования» в облаке.
Будущая волна ИИ должна сломать «черный ящик ИИ» и понять причины решений и прогнозов, сделанных моделью машинного обучения. Другая важная область будущей волны искусственного интеллекта — учиться на ограниченных наборах данных или «малых данных».
Спасибо, что прочитали эту статью, и я надеюсь, что она была вам полезна. Пожалуйста, не стесняйтесь делиться любыми отзывами и задавать любые вопросы, которые у вас могут возникнуть. мой LinkedIn: Авайс Баджва .
31 Лучшие примеры искусственного интеллекта, которые вы должны знать 2022
Примеры искусственного интеллекта в поп-культуре обычно включают в себя группу интеллектуальных роботов, одержимых свержением человечества, или, по крайней мере, модный тематический парк. Разумных машин с общим искусственным интеллектом пока не существует, и, скорее всего, не будет в ближайшее время, так что мы в безопасности… пока.
Это не преуменьшает потенциальное влияние ИИ на наше будущее. Опрос Pew Research 2021 года показал, что 37 процентов респондентов, которые больше обеспокоены, чем воодушевлены ИИ, обеспокоены потерей работы, конфиденциальностью и потенциалом ИИ «превзойти человеческие навыки». Кроме того, технический миллиардер Илон Маск, долгое время выступавший за регулирование искусственного интеллекта, назвал искусственный интеллект более опасным, чем ядерное оружие. Несмотря на эти обоснованные опасения, нам еще далеко до жизни в Мире Дикого Запада 9.0841 .
Artificial Intelligence Examples
- Manufacturing robots
- Self-driving cars
- Smart assistants
- Healthcare management
- Automated financial investing
- Virtual travel booking agent
- Social media monitoring
- Marketing chatbots
Whether we realize Так это или нет, но ИИ окружает нас повсюду и играет активную роль в нашей повседневной жизни. Каждый раз, когда мы открываем нашу ленту новостей в Facebook, выполняем поиск в Google, получаем рекомендацию продукта от Amazon или бронируем поездку онлайн, ИИ скрывается на заднем плане.
Познакомьтесь поближе с этими 34 примерами искусственного интеллекта, демонстрирующими широту применения технологии в различных отраслях.
Изображение: Shutterstock
AI Robotics
Лидеры отрасли до сих пор не могут договориться о том, что означает термин «робот». Робототехники понимают роботов как программируемые машины, выполняющие задачи, но никто не может точно определить, где заканчивается это определение.
Сегодняшние роботы с искусственным интеллектом или, по крайней мере, те машины, которые считаются таковыми, не обладают естественным общим интеллектом, но они — это , способные решать проблемы и «думать» в ограниченном объеме.
От работы на сборочных линиях в Tesla до обучения японских студентов английскому языку — примеры применения ИИ в области робототехники многочисленны.
Местоположение: Бедфорд, Массачусетс
iRobot, вероятно, наиболее известен разработкой Roomba, популярного интеллектуального робота-пылесоса, который использует ИИ для сканирования размера комнаты, определения препятствий и запоминания наиболее эффективных маршрутов уборки. Саморазворачивающийся Roomba также может определить, сколько пылесосить нужно, в зависимости от размера комнаты, и ему не требуется помощь человека для мытья полов.
Получайте уведомления о вакансиях от iRobot
Местоположение: Гонконг, Китай
Hanson Robotics создает человекоподобных роботов с искусственным интеллектом как для коммерческого, так и для потребительского рынка.
София, созданная Хэнсоном, — невероятно продвинутый робот, способный к социальному обучению. С помощью ИИ София может эффективно общаться на естественном языке и использовать выражения лица для передачи человеческих эмоций.
София стала чем-то вроде медийной знаменитости, ее фигурировали в различных ток-шоу, включая запоминающееся появление с явно сбитым с толку Джимми Фэллоном на 908:38 Вечернее шоу. Робот даже принял гражданство Саудовской Аравии.
Получайте уведомления о вакансиях от Hanson Robotics
Связанная статья35 Робототехника на переднем крае инноваций
Местоположение: Сан-Франциско, Калифорния двигатель эмоций», что делает его «способным распознавать лица и основные человеческие эмоции». При росте 4 фута Pepper может работать более чем на дюжине языков и имеет сенсорный экран для поддержки связи.
Softbank также разработал двуногого робота NAO, который можно использовать в образовательных и исследовательских целях, а также автономный пылесос Whiz для коммерческой уборки.
Получайте уведомления о вакансиях от Softbank Robotics. Компания выпустила Flippy 2, второе поколение своего робота с искусственным интеллектом, который помогает автоматизировать кухню для таких задач, как жарка.
Компания также разрабатывает свою линейку CookRight с системами контроля приготовления на гриле и приготовления кофе. Кроме того, Miso Robotics разработала диспенсер для напитков, который можно интегрировать с системой торговых точек заведения для упрощения и автоматизации розлива напитков.
Получайте уведомления о вакансиях от Miso Robotics
ИИ и умные помощники
Если вы когда-либо просили Siri помочь найти ваши AirPods или просили Amazon Alexa выключить свет, то, возможно, вы взаимодействовали с одним из наиболее распространенные формы искусственного интеллекта, проникающие в повседневную жизнь.
ИИ является основой умных помощников, доступ к которым в настоящее время можно получить через большинство телефонов на рынке, а также они интегрируются в автомобили и устройства для умного дома. По состоянию на 2022 год более 120 миллионов взрослых в США используют умного помощника не реже одного раза в месяц.
Вот некоторые из компаний, предлагающих потребителям умных помощников, оснащенных искусственным интеллектом.
Местоположение: Купертино, Калифорния
Siri, цифровой помощник Apple, существует с 2011 года, когда он был интегрирован в операционную систему технологического гиганта при запуске iPhone 4S. Apple описывает его как «самый частный цифровой помощник». Siri использует искусственный интеллект, чтобы помочь пользователям в таких вещах, как установка таймеров и напоминаний, совершение телефонных звонков и поиск в Интернете.
Адрес: Редмонд, Вашингтон
Корпорация Майкрософт присоединилась к тренду умных помощников в 2014 году, выпустив Cortana для Windows Phone 8.1. Cortana теперь служит «помощником по личной продуктивности», интегрированным в набор приложений Microsoft 365. Например, этот помощник с поддержкой искусственного интеллекта может напоминать пользователям Microsoft об электронных письмах, требующих дальнейших действий, или распознавать голосовые инструкции для присоединения к собранию через приложение Teams.
Местонахождение: Сувон-Си, Южная Корея
Samsung представила своего интеллектуального помощника Bixby в рамках выпуска своих моделей Galaxy S8 и S8+ в 2018 году. Он работает с быстрыми командами, чтобы открыть камеру телефона или запустить определенный плейлист. , но Bixby также может выключать свет с помощью устройств умного дома или помогать находить такие предметы, как потерянные наушники Bluetooth. Помимо портативных устройств, таких как телефоны и планшеты, к Bixby также можно получить доступ через определенные устройства Samsung, такие как умные холодильники.
Адрес: Санта-Клара, Калифорния
Бренды могут сотрудничать с SoundHound для разработки и настройки умных помощников с использованием голосовой платформы искусственного интеллекта компании. Netflix, Pandora и Mercedes-Benz входят в число компаний, которые работали с SoundHound над голосовыми решениями. Основываясь на своих технологиях преобразования речи в смысл и глубокого понимания смысла, SoundHound может интегрировать распознавание речи, разговорный искусственный интеллект и другие компоненты в автомобили и устройства умного дома.
Изображение: Shutterstock
ИИ в здравоохранении
Искусственный интеллект меняет правила игры в здравоохранении, улучшая практически все аспекты отрасли, от роботизированных операций до защиты личных данных от киберпреступников.
Здравоохранение долгое время страдало от стремительного роста медицинских расходов и неэффективных процессов. Искусственный интеллект преображает оклеветанную отрасль, в которой она так нуждается.
Виртуальные помощники с поддержкой искусственного интеллекта сокращают количество ненужных посещений больниц и возвращают медсестрам 20 процентов своего рабочего времени; помощники по рабочему процессу помогают врачам высвободить 17% рабочего времени; фармацевтические компании изучают жизненно важные лекарства в разы быстрее и дешевле, чем обычно; и ИИ даже используется, чтобы помочь обеспечить здравоохранение в слаборазвитых странах.
Вот несколько примеров того, как искусственный интеллект оптимизирует процессы и открывает новые инновационные возможности для отрасли здравоохранения.
Адрес: Нью-Йорк, Нью-Йорк
Covera Health использует совместный обмен данными и прикладной клинический анализ, чтобы уменьшить количество ошибочно диагностированных пациентов во всем мире. Запатентованная технология компании использует структуру, которая сочетает в себе передовую науку о данных и искусственный интеллект для сортировки существующей диагностики, чтобы предоставить практикующим врачам более точные данные о симптомах при принятии решения, которое окажет серьезное влияние на жизнь пациента.
Адрес: Чапел-Хилл, Северная Каролина
Well позволяет людям жить лучше и быстро получать необходимую им медицинскую помощь, что позволяет им принимать более обоснованные решения об уходе за собой.
Управляемый запатентованным «движком здоровья» ИИ, который помогает персонализировать рекомендации по здоровью, Well направляет людей на основе их ранее существовавших заболеваний, текущих проблем со здоровьем и пробелов в общих знаниях о здоровье. Модуль здоровья объединяет как личные, так и внешние данные о состоянии здоровья, чтобы предоставлять обоснованные рекомендации, основанные на опыте других пользователей. Он также дает очки, которые можно использовать в магазинах для выполнения задач и поддержки сообществ. Well помогает пользователям во всем: от скрининга и анкет до поддержки рецептов, советов по вакцинации, рекомендуемых посещений врачей и рекомендаций по конкретным заболеваниям.
Местоположение: Бостон, штат Массачусетс
Компания PathAI создает технологию на основе искусственного интеллекта для патологоанатомов. Алгоритмы машинного обучения компании помогают патологоанатомам анализировать образцы тканей и ставить более точные диагнозы. Цель состоит не только в повышении точности диагностики, но и в лечении. Технология PathAI также может определять оптимальных участников клинических испытаний.
Компания PathAI сотрудничала с Фондом Билла и Мелинды Гейтс и компанией Philips над разработкой крупномасштабных инструментов поддержки прогностических тестов и планов по постоянному доступу к их передовым диагностическим услугам.
Адрес: Сан-Франциско, Калифорния
Atomwise использует искусственный интеллект и глубокое обучение для облегчения поиска лекарств. Используя технологию, основанную на сверточных нейронных сетях, алгоритмы Atomwise могут «извлекать информацию из миллионов экспериментальных измерений сродства и тысяч белковых структур, чтобы предсказывать связывание небольших молекул с белками».
Благодаря возможности анализировать миллиарды соединений и определять области для разработки лекарств, эта технология быстро ускоряет работу химиков. Atomwise использовался для решения некоторых из самых насущных медицинских проблем, включая лихорадку Эбола и рассеянный склероз.
Адрес: Нью-Йорк, Нью-Йорк
Пейджер использует искусственный интеллект, чтобы помочь пациентам с незначительными болями и болезнями.
Компания применяет машинное обучение для анализа клинических данных и утверждает данные, чтобы обнаруживать пробелы в лечении пациентов. В дополнение к рекомендациям по медицинскому обслуживанию, эта услуга, похожая на консьержа, помогает пациентам назначать встречи и производить платежи.
Приложение Pager позволяет любому пользователю круглосуточно и без выходных общаться с медсестрой в текстовом чате, общаться с врачом в видеочате и получать рецепты по мере необходимости.
Получайте оповещения о вакансиях от Pager
Статьи по темеБлокчейн в здравоохранении: 17 примеров, которые нужно знать
Изображение: Shutterstock
Самоуправляемые автомобили
Самоуправляемые автомобили — верный признак того, что будущее за нами. Когда-то считавшаяся научной фантастикой, технология автономного вождения постепенно приближается к беспилотной реальности. На самом деле ожидается, что к 2040 году на дороги выйдут более 33 миллионов автономных транспортных средств. Мы можем поблагодарить искусственный интеллект за прорывы, которые мы наблюдаем в действительно футуристической технологии.
Искусственный интеллект в буквальном смысле определяет будущее автономных автомобилей. Эти автомобили оснащены датчиками, которые постоянно фиксируют все, что происходит вокруг автомобиля, и используют искусственный интеллект для внесения правильных корректировок. Эти датчики собирают тысячи точек данных каждую миллисекунду (например, скорость автомобиля, дорожные условия, местонахождение пешеходов, другой трафик и т. д.) и используют искусственный интеллект, чтобы помочь интерпретировать данные и действовать соответствующим образом — и все это в мгновение ока.
Возможно, нам еще предстоит пройти долгий путь, прежде чем мы полностью научимся автономному вождению, но приведенные ниже компании прокладывают путь к будущему автономного вождения.
Адрес: Бостон, Массачусетс
Компания Motional использует передовые технологии, основанные на искусственном интеллекте и машинном обучении, чтобы сделать беспилотные автомобили более безопасными, надежными и доступными.
Компания была создана в результате совместного предприятия автомобильной технологической компании Apertiv и Hyundai Motor Group.
Сочетая датчики LiDAR ближнего и дальнего действия, радар, стратегическое размещение камер и запатентованные технологии, разрабатываемые с 2016 года, компания Motional обеспечила более 100 000 поездок с самостоятельным вождением, сохранив при этом ноль аварийных происшествий. Компания сотрудничает с такими крупными организациями, как Lyft, Via и Uber Eats, чтобы довести свои технологии до еще большего масштаба.
Адрес: Сан-Франциско, Калифорния
Беспилотные автомобили Cruise одними из первых в мире отправились в путь, используя искусственный интеллект, чтобы проложить путь. Беспилотные автомобили ежедневно собирают петабайты информации. ИИ использует этот огромный набор данных, чтобы постоянно узнавать о лучших мерах безопасности, методах вождения и наиболее эффективных маршрутах, чтобы дать гонщику уверенность в том, что он в безопасности.
Местонахождение: Маунтин-Вью, Калифорния
Waymo — проект беспилотных автомобилей Google. Компания производит различные автономные транспортные средства, предназначенные для удовлетворения потребностей водителей, в том числе частных лиц, водителей совместных поездок и крупных транспортных компаний.
Автомобили Waymo уже проехали миллионы миль в более чем 10 штатах, используя ИИ для сбора и анализа данных. Благодаря расширенному набору датчиков каждое транспортное средство Waymo собирает данные и использует искусственный интеллект для расшифровки того, что произойдет дальше. Благодаря искусственному интеллекту автомобили Waymo могут анализировать ситуации и делать безопасные прогнозы для оптимальных следующих действий без необходимости взаимодействия человека с рулевым колесом.
Местоположение: Остин, Техас
У Tesla есть четыре модели электромобилей с возможностью автономного вождения. Компания использует искусственный интеллект для разработки и улучшения технологий и программного обеспечения, которые позволяют ее автомобилям автоматически тормозить, менять полосу движения и парковаться.
В своем отчете о влиянии на 2021 год Tesla сообщила, что зафиксировала 0,22 аварии на каждый 1 миллион миль, пройденных с использованием технологии автопилота, по сравнению с 0,77 аварии для водителей, которые не использовали автопилот и другие функции автопилота.
Получайте уведомления о вакансиях от Tesla. Датчики компании используют волоконные лазеры, которые дают системе искусственного интеллекта беспилотного автомобиля всесторонний взгляд на окружающий мир. Эта технология позволяет программным системам на основе искусственного интеллекта видеть людей, объекты, события и дорожные условия на расстоянии более 250 метров, поэтому у автономного транспортного средства будет достаточно времени для анализа и реагирования на любую ситуацию. Инновационная технология имеет возможность измерять скорость различных объектов, поэтому автономный автомобиль может легко расшифровать свое наиболее оптимальное движение за безопасное время.
Получайте уведомления о вакансиях от Luminar
Изображение: Shutterstock
ИИ в финансах
Искусственный интеллект и финансовая индустрия — это союз, заключенный на небесах. Финансовый сектор полагается на точность, отчетность в режиме реального времени и обработку больших объемов количественных данных для принятия решений, во всех областях интеллектуальные машины преуспевают.
Поскольку отрасль отмечает эффективность и точность ИИ, она быстро внедряет автоматизацию, адаптивный интеллект, алгоритмическая торговля и машинное обучение в финансовых процессах.
Вот несколько примеров того, как искусственный интеллект меняет финансовую отрасль.
Адрес: Нью-Йорк, Нью-Йорк
Betterment — это автоматизированная платформа для финансовых инвестиций и пионер технологии роботов-консультантов, которая использует искусственный интеллект для получения информации об инвесторе и создания персонализированного профиля на основе его финансовых планов.
Роботы-консультанты Betterment используют алгоритмы для автоматизации сбора налоговых убытков, торговли, транзакций и управления портфелем — всех задач, которые раньше требовали большого количества человеческих усилий и ноу-хау.
Betterment управляет активами на сумму 33 миллиарда долларов и обслуживает более 730 000 клиентов.
Получайте оповещения о вакансиях от Betterment
Местоположение: Нью-Йорк, Нью-Йорк
AlphaSense создала поисковую систему на базе искусственного интеллекта, чтобы помочь инвестиционным фирмам получить информационное преимущество.
Используя комбинацию лингвистического поиска и обработки естественного языка, программа может анализировать ключевые точки данных по 35 000 финансовых учреждений. Способность системы сканировать миллионы точек данных и генерировать действенные отчеты на основе соответствующих финансовых данных экономит аналитикам бесчисленные часы работы.
Согласно веб-сайту компании, более 800 финансовых компаний используют AlphaSense, в том числе некоторые корпорации из списка Fortune 500.
Numerai — это хедж-фонд на основе искусственного интеллекта, использующий краудсорсинговое машинное обучение от тысяч специалистов по данным со всего мира.
Компания предоставляет абстрактные финансовые данные своему сообществу специалистов по данным, которые используют различные модели машинного обучения для прогнозирования фондового рынка. Модели соревнуются друг с другом в еженедельном турнире, где создатели соревнуются за Numeraire (NMR), криптовалюту компании. Самые точные прогнозы попадают на вершину таблицы лидеров и получают больше жетонов.
Но Numerai на самом деле не предназначен для награждения победителей и проигравших. Конкурс — это просто способ собрать больше моделей. Настоящий прорыв компании заключается в том, как она синтезирует все различные подходы в «метамодель». Разнообразие моделей в рамках «метамодели» создает разнообразие в портфеле, снижая риск и обеспечивая более высокую доходность. Проще говоря, чем больше алгоритмов работает, тем лучше.
Получайте уведомления о вакансиях от Numerai
Статьи по теме81 Финтех-компании и стартапы, которые нужно держать в кармане
Изображение: Shutterstock
ИИ в путешествиях и транспорте
Искусственный интеллект становится мегатенденцией в индустрии путешествий и транспорта. От организации поездок до предложения наиболее эффективного маршрута домой после работы ИИ упрощает передвижение.
Туристические компании особенно извлекают выгоду из повсеместного использования смартфонов. Более 70 процентов пользователей утверждают, что они бронируют поездки на своих телефонах, просматривают советы путешественникам и изучают местные достопримечательности и рестораны. Каждый третий человек говорит, что использовал виртуального помощника для планирования предстоящих поездок.
Чат-боты на базе искусственного интеллекта быстро меняют индустрию туризма, облегчая взаимодействие с клиентами, как человек, для более быстрого ответа, более выгодных цен на бронирование и даже рекомендаций по путешествиям.
Вот несколько примеров использования искусственного интеллекта в индустрии путешествий и транспорта.
Местоположение: Полностью удаленно
Hopper использует искусственный интеллект, чтобы предсказывать, когда вы сможете бронировать билеты по самым низким ценам на авиабилеты, отели, аренду автомобилей и домов для отпуска. ИИ компании сканирует сотни бронирований и представляет самые актуальные цены. Но в этом ИИ есть гораздо больше.
Используя исторические данные о рейсах и отелях, Hopper также будет давать пользователю рекомендации о том, достигло ли бронирование самой низкой ценовой точки или следует ли пользователю продержаться немного дольше, чтобы цена упала. Алгоритм Хоппера на основе искусственного интеллекта сэкономил пользователям более 4 миллиардов долларов.
Получайте уведомления о вакансиях от Hopper
Местоположение: Маунтин-Вью, Калифорния
Google использует искусственный интеллект в ряде областей, но специальное приложение этой технологии в Google Maps немного упрощает наши поездки на работу.
Благодаря картографии с поддержкой искусственного интеллекта технология поискового гиганта сканирует информацию о дорогах и использует алгоритмы для определения оптимального маршрута, будь то пешком или на автомобиле, велосипеде, автобусе или поезде.
Google усовершенствовал искусственный интеллект в приложении «Карты», интегрировав голосового помощника и создав карты дополненной реальности, чтобы помочь пользователям ориентироваться в режиме реального времени.
Изображение: Shutterstock
ИИ в социальных сетях
Имея более 2,77 миллиарда активных профилей на таких платформах, как Twitter, Facebook и Snapchat, социальные сети ведут постоянную борьбу за персонализацию и создание полезного опыта для пользователей.
Искусственный интеллект может создать или разрушить будущее отрасли.
Благодаря своей способности упорядочивать огромные объемы данных, распознавать изображения, внедрять чат-ботов и прогнозировать изменения в культуре, ИИ представляет большую ценность для отрасли с миллиардами пользователей и годовым доходом около 45 миллиардов долларов.
Кроме того, передовое машинное обучение, вероятно, окажется критически важным в отрасли, которая вынуждена контролировать фейковые новости, разжигание ненависти и другие недобросовестные действия в режиме реального времени.
Вот несколько примеров того, как некоторые из самых громких имен в игре используют искусственный интеллект.
Местоположение: Сан-Франциско, Калифорния
ИИ Slack использует структуру данных, называемую «рабочий график», для сбора информации о том, как каждая компания и ее сотрудники используют инструмент и взаимодействуют друг с другом.
Затем данные из «рабочего графика» можно использовать для обучения моделей ИИ, которые делают Slack более удобным для пользователя. Например, по оценкам компании, средний пользователь получает более 70 сообщений в день. Slack использует машинное обучение и обработку естественного языка в функции под названием «Основные моменты», чтобы перемещать наиболее релевантные сообщения вверх.
В дополнение к «Основным», поиск Slack использует ИИ, чтобы помочь пользователям точно определить экспертов по знаниям и каналы, по которым с ними можно связаться, на основе анализа того, кто говорит о чем и где.
Местоположение: Менло-Парк, Калифорния
Будь то чат-боты Messenger, алгоритмические новостные ленты, предложения по тегам фотографий или таргетинг рекламы, искусственный интеллект глубоко встроен в платформу Meta Facebook.
Команда искусственного интеллекта компании обучила модель распознавания изображений с точностью 85 процентов, используя миллиарды общедоступных фотографий Instagram, помеченных хэштегами. Этот метод является крупным прорывом в моделировании компьютерного зрения.
Facebook уже использует комбинацию искусственного интеллекта и модерации людьми для борьбы со спамом и злоупотреблениями. Благодаря прорывам в распознавании изображений и удвоению исследований в области искусственного интеллекта Meta рассчитывает на искусственный интеллект, который поможет ей контролировать крупнейшую в мире медиа-платформу.
Получайте уведомления о вакансиях от Meta
Местоположение: Сан-Франциско, Калифорния
Вы можете поблагодарить ИИ за твиты, которые вы видите в Твиттере. Алгоритмы гиганта социальных сетей предлагают людям подписаться, твиты и новости на основе индивидуальных предпочтений пользователя.
Кроме того, Twitter использует искусственный интеллект для мониторинга и классификации видеопотоков по тематике. Инструмент компании для обрезки изображений также использует искусственный интеллект, чтобы определить, как обрезать изображения, чтобы сфокусироваться на самой интересной части.
ИИ Twitter также начал работу по выявлению ненавистнических высказываний и террористических выражений в твитах. В первой половине 2017 года компания обнаружила и заблокировала 300 000 аккаунтов, связанных с террористами, 95% из которых были обнаружены нечеловеческими машинами с искусственным интеллектом.
Получайте оповещения о вакансиях из Twitter
Изображение: Shutterstock
ИИ в розничной торговле
Вы когда-нибудь прокручивали веб-сайт только для того, чтобы найти изображение именно той рубашки, которую вы только что рассматривали на другом сайте? За это можно поблагодарить искусственный интеллект.
Внедрение машинного обучения в процессы электронной коммерции и розничной торговли позволяет компаниям строить личные отношения с клиентами. Алгоритмы на основе искусственного интеллекта персонализируют пользовательский опыт, увеличивают продажи и строят лояльные и долгосрочные отношения.
Компании используют искусственный интеллект для развертывания чат-ботов, прогнозирования покупок и сбора данных, чтобы сделать процесс покупок более ориентированным на клиента. Вот как некоторые крупные лидеры розничной торговли и электронной коммерции внедряют ИИ для повышения продаж и лояльности.
Местоположение: Полностью удаленно
LivePerson революционизирует сферу продаж и маркетинга с помощью разговорного ИИ. Компании могут создавать разговорную рекламу с помощью технологии LivePerson, привлекая потребителей на веб-сайтах компаний, в социальных сетях и других сторонних каналах. Вместо того, чтобы переходить на целевые страницы, потребители теперь могут получить доступ к персонализированным взаимодействиям с помощью предпочитаемого ими метода.
Разговорный ИИ LivePerson также дает клиентам возможность отправлять сообщения вместо звонков, сокращая объем звонков, время ожидания и затраты. Поскольку эта технология искусственного интеллекта взаимодействует с потребителями и клиентами в соответствующие моменты, компании могут повышать конверсию и строить отношения благодаря исключительному сервису.
Адрес: Остин, Техас
Whole Foods внедряет технологию Amazon Just Walk Out в магазинах в Вашингтоне, округ Колумбия, и Шерман-Оукс, Калифорния, что позволяет покупателям отказаться от посещения кассы.
Система использует компьютерное зрение, слияние датчиков и глубокое обучение, чтобы отслеживать каждый товар, который покупатели кладут или вынимают из своей корзины, и создает соответствующую виртуальную корзину для покупок. Покупатели могут подключить свой способ оплаты при входе в магазин, а затем они получат цифровую квитанцию после выхода без какого-либо взаимодействия с оплатой.
Местоположение: Сиэтл, Вашингтон
Amazon — король искусственного интеллекта в электронной коммерции. Будь то рекомендации компании о том, какие продукты покупать, складские роботы, которые захватывают, сортируют и отправляют продукты, или веб-сервисы, обеспечивающие работу самого веб-сайта, Amazon использует ИИ практически на каждом этапе своего процесса. Проще говоря, если вы вообще что-то делали на Amazon за последние пять лет, вам в этом помог алгоритм.
В 2014 году компания представила голосового помощника Alexa на базе искусственного интеллекта. Вдохновленная компьютерами из Star Trek, Alexa открыла волну мощных виртуальных помощников, управляемых разговором.
Получайте оповещения о вакансиях от Amazon
Изображение: Shutterstock
ИИ в маркетинге
Маркетологи выделяют все больше и больше своих бюджетов на внедрение искусственного интеллекта, поскольку машинное обучение имеет десятки применений, когда речь идет об успешном управлении маркетингом и рекламными кампаниями. .
Еще одна причина увеличения бюджета? Инструменты на базе искусственного интеллекта, такие как чат-боты и автоматическая покупка и размещение рекламы, теперь стали широко доступны для малого и среднего бизнеса.
Вот несколько примеров маркетинговых и рекламных инструментов на базе ИИ.
Адрес: Полностью удаленно
Drift использует чат-боты, машинное обучение и обработку естественного языка, чтобы помочь компаниям назначать больше встреч, помогать клиентам с вопросами о продуктах и повышать эффективность цикла продаж.
Эта технология может автоматизировать традиционно трудоемкие маркетинговые задачи, включая ответы на электронные письма, маршрутизацию потенциальных клиентов и обновление контактной информации. Например, когда клиент находится на веб-сайте с помощью Drift, появится чат-бот, который задаст вопросы и автоматически включит их в кампанию, если они являются лидами. Drift используется более чем 100 000 предприятий.
Местоположение: Санта-Моника, Калифорния
GumGum использует искусственный интеллект для оптимизации и автоматизации рекламы. Платформа контекстной аналитики компании Verity способна анализировать видео-, аудио-, графические и письменные материалы, чтобы убедиться, что они актуальны для клиентов, и определить идеальные места размещения рекламы для максимального охвата на основе контекста, а не на основе данных из сторонних файлов cookie. GumGum работал с крупными брендами, включая Starbucks, Microsoft, Popeyes, Target и American Express.