Нейросети: как искусственный интеллект помогает в бизнесе и жизни. Машинный интеллект
МАШИННЫЙ ИНТЕЛЛЕКТ - это... Что такое МАШИННЫЙ ИНТЕЛЛЕКТ?
МАШИННЫЙ ИНТЕЛЛЕКТ — способность средств вычислительной техники моделировать и реализовывать различные виды естественной интеллектуальной деятельности человека или его поведение. Результаты достигаются на базе совокупности таких характеристик компьютера, как объём информации («знания») в его памяти, способность к её пополнению путём самообучения и самоорганизации, степень реализации языков (см.) программирования высокого уровня и степень понимания входного языка при общении человека с машиной, показатель быстродействия при экспертных оценках, способность к решению задач управления, а также распознаванию образов и принятию решений, относимых к сфере искусственного интеллекта (управление полётом и работой порта, доказательство теорем, игра в шахматы и др.).
Большая политехническая энциклопедия. - М.: Мир и образование. Рязанцев В. Д.. 2011.
- МАШИННОЕ СЛОВО
- МАШИННЫЙ ПЕРЕВОД
Смотреть что такое "МАШИННЫЙ ИНТЕЛЛЕКТ" в других словарях:
Дружественный искусственный интеллект — «Дружественный искусственный интеллект» или «ДИИ» (англ: FAI) это искусственный интеллект (ИИ), который обладает скорее позитивным, чем негативным влиянием на человечество. ДИИ также относится к области исследований, целью которых является… … Википедия
Искусственный интеллект — Запрос «ИИ» перенаправляется сюда; см. также другие значения. Искусственный интеллект (ИИ, англ. Artificial intelligence, AI) наука и технология создания интеллектуальных машин, особенно интеллектуальных компьютерных программ. ИИ… … Википедия
Искусственный Интеллект — (ИИ) (англ. Artificial intelligence, AI) это наука и разработка интеллектуальных машин и систем, особенно интеллектуальных компьютерных программ, направленных на то, чтобы понять человеческий интеллект. При этом используемые методы не обязаны… … Википедия
Игровой искусственный интеллект — (англ. Game artificial intelligence) набор программных методик, которые используются в компьютерных играх для создания иллюзии интеллекта в поведении персонажей, управляемых компьютером. Игровой ИИ, помимо методов традиционного… … Википедия
Вычислительный интеллект — (англ. Computational intelligence (CI)) ответвление искусственного интеллекта. Как альтернатива классическому искусственному интеллекту, основанному на строгом логическом выводе, он опирается на эвристические алгоритмы, используемые,… … Википедия
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ — область компьютерной науки (информатики), специализирующаяся на моделировании интеллектуальных и сенсорных способностей человека с помощью вычислительных устройств. Технологические основы для постановки проблемы И.и. возникли в результате… … Философская энциклопедия
Роевой интеллект — (англ. Swarm intelligence) описывает коллективное поведение децентрализованной самоорганизующейся системы. Рассматривается в теории искусственного интеллекта как метод оптимизации. Термин был введен Херардо Бени и Ван Цзином в 1989 году, в… … Википедия
Искусственный интеллект — проблемная область исследований (научное направление и прикладные разработки) по моделированию человеческой способности к творческой деятельности. Направление научных исследований, называемое «искусственный интеллект», возникло в 60 х гг. XX в.… … Энциклопедия культурологии
искусственный интеллект — раздел информатики, включающий разработку методов моделирования и воспроизведения с помощью компьютера отдельных функций творческой деятельности человека, решение проблемы представления знаний в компьютере и построение баз знаний, создание… … Энциклопедия техники
Тест Тьюринга — Стандартная интерпретация теста Тьюринга Тест Тьюринга эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум» (англ. … Википедия
polytechnic_dictionary.academic.ru
Различия между искусственным интеллектом, машинным обучением и глубоким обучением
Искусственный интеллект движется огромными шагами — от достижений в области беспилотных транспортных средств и способности обыгрывать человека в такие игры, как покер и Го, к автоматизированному обслуживанию клиентов. Искусственный интеллект — это передовая технология, которая готова произвести революцию в бизнесе.
Часто термины искусственный интеллект, машинное обучение и глубокое обучение используются бессистемно как взаимозаменяемые, но, на самом деле, между ними есть различия. Чем именно различаются эти термины будет рассказано далее.
Искусственный интеллект (ИИ)
Искусственный интеллект — широкое понятие, касающееся передового машинного интеллекта. В 1956 году на конференции по искусственному интеллекту в Дартмуте эта технология была описана следующим образом: «Каждый аспект обучения или любая другая особенность интеллекта могут быть в принципе так точно описаны, что машина сможет сымитировать их.»Искусственный интеллект может относиться к чему угодно — от компьютерных программ для игры в шахматы до систем распознавания речи, таких, например, как голосовой помощник Amazon Alexa, способный воспринимать речь и отвечать на вопросы. В целом системы искусственного интеллекта можно разделить на три группы: ограниченный искусственный интеллект (Narrow AI), общий искусственный интеллект (AGI) и сверхразумный искусственный интеллект.
Программа Deep Blue компании IBM, которая в 1996 году обыграла в шахматы Гарри Каспарова, или программа AlphaGo компании Google DeepMind, которая в 2016 году обыграла чемпиона мира по Го Ли Седоля, являются примерами ограниченного искусственного интеллекта, способного решать одну конкретную задачу. Это его главное отличие от общего искусственного интеллекта (AGI), который стоит на одном уровне с человеческим интеллектом и может выполнять много разных задач.
Сверхразумный искусственный интеллект стоит на ступень выше человеческого. Ник Бостром описывает его следующим образом: это «интеллект, который намного умнее, чем лучший человеческий мозг, практически во всех областях, в том числе в научном творчестве, общей мудрости и социальных навыках.» Другими словами, это когда машины станут намного умнее нас.
Машинное обучение
Машинное обучение является одним из направлений искусственного интеллекта. Основной принцип заключается в том, что машины получают данные и «обучаются» на них. В настоящее время это наиболее перспективный инструмент для бизнеса, основанный на искусственном интеллекте. Системы машинного обучения позволяют быстро применять знания, полученные при обучении на больших наборах данных, что позволяет им преуспевать в таких задачах, как распознавание лиц, распознавание речи, распознавание объектов, перевод, и многих других. В отличие от программ с закодированными вручную инструкциями для выполнения конкретных задач, машинное обучение позволяет системе научиться самостоятельно распознавать шаблоны и делать прогнозы.Заинтересован ли Ваш бизнес в интеграции машинного обучения в свою стратегию? Amazon, Baidu, Google, IBM, Microsoft и другие уже предлагают платформы машинного обучения, которые могут использовать предприятия.
Глубокое обучение
Глубокое обучение является подмножеством машинного обучения. Оно использует некоторые методы машинного обучения для решения реальных задач, используя нейронные сетей, которые могут имитировать человеческое принятие решений. Глубокое обучение может быть дорогостоящим и требует огромных массивов данных для обучения. Это объясняется тем, что существует огромное количество параметров, которые необходимо настроить для алгоритмов обучения, чтобы избежать ложных срабатываний. Например, алгоритму глубокого обучения может быть дано указание «узнать», как выглядит кошка. Чтобы произвести обучение, потребуется огромное количество изображений для того, чтобы научиться различать мельчайшие детали, которые позволяют отличить кошку от, скажем, гепарда или пантеры, или лисицы.Глубокое обучение также имеет бизнес-приложения. Можно взять огромное количество данных — миллионы изображений, и с их помощью выявить определенные характеристики. Текстовый поиск, обнаружение мошенничества, обнаружения спама, распознавание рукописного ввода, поиск изображений, распознавание речи, перевод — все эти задачи могут быть выполнены с помощью глубокого обучения. Например, в Google сети глубокого обучения заменили много «систем, основанных на правилах и требующих ручной работы».
Стоит отметить, что глубокое обучение может быть весьма «предвзятым». Например, когда была первоначально развернута система распознавания лиц Google, она помечала много черных лиц как гориллы. «Это пример того, что произойдет, если у вас нет афроамериканских лиц в вашем наборе обучения», сказала Anu Tewary, главный специалист по работе с данными Mint at Intuit. «Если у вас нет афроамериканцев, работающих над системой, если у вас нет афроамериканцев, тестирующих систему, то, когда ваша система сталкивается с афроамериканскими лицами, она не будет знать, как вести себя.»
Существует мнение, что тема глубокого обучения сильно раздута. Система Sundown AI, например, предоставляет автоматизированные взаимодействия с клиентами с использованием комбинации машинного обучения и policy graph алгоритмов без использования глубокого обучения.
Оригинал статьи — «Understanding the differences between AI, machine learning, and deep learning».
habr.com
как искусственный интеллект помогает в бизнесе и жизни / Хабр
В работе Oxford Martin School 2013 года говорилось о том, что 47% всех рабочих мест может быть автоматизировано в течение следующих 20 лет. Основным драйвером этого процесса является применение искусственного интеллекта, работающего с большими данными, как более эффективной замены человеку.
Машины теперь способны решать все больше процессов, за которые раньше отвечали люди. Кроме того, делают это качественнее и во многих случаях дешевле. О том, что это значит для рынка труда, в июле этого года говорил Герман Греф, выступая перед студентами Балтийского федерального университета им. Канта:
“Мы перестаём брать на работу юристов, которые не знают, что делать с нейронной сетью. <...> Вы — студенты вчерашнего дня. Товарищи юристы, забудьте свою профессию. В прошлом году 450 юристов, которые у нас готовят иски, ушли в прошлое, были сокращены. У нас нейронная сетка готовит исковые заявления лучше, чем юристы, подготовленные Балтийским федеральным университетом. Их мы на работу точно не возьмем.” Продолжая освещать #технобудущее, команда DTI подготовила все, что необходимо знать для первого погружения в нейронные сети: как они устроены, почему все больше компаний предпочитают нейросети живым сотрудникам и какой потенциал по оптимизации различных процессов несет эта технология.
Искусственный интеллект, машинное обучение и нейросети: в чем разница
Нейронная сеть – один из способов реализации искусственного интеллекта (ИИ).В разработке ИИ существует обширная область — машинное обучение. Она изучает методы построения алгоритмов, способных самостоятельно обучаться. Это необходимо, если не существует четкого решения какой-либо задачи. В этом случае проще не искать правильное решение, а создать механизм, который сам придумает метод для его поиска.
#справка Во многих статьях можно встретить термин «глубокое» — или «глубинное» — обучение. Под ним понимают алгоритмы машинного обучения, использующие много вычислительных ресурсов. В большинстве случаев под ним можно понимать просто “нейронные сети”.
Чтобы не запутаться в понятиях «искусственный интеллект», «машинное обучение» и «глубокое обучение», предлагаем посмотреть на визуализацию их развития:
#интересное Существует два типа искусственного интеллекта (ИИ): слабый (узконаправленный) и сильный (общий). Слабый ИИ предназначен для выполнения узкого списка задач. Такими являются голосовые помощники Siri и Google Assistant и все остальные примеры, которые мы приводим в этой статье. Сильный ИИ, в свою очередь, способен выполнить любую человеческую задачу. На данный момент реализация сильного ИИ невозможна, он является утопической идеей.
Как устроена нейросеть
Нейросеть моделирует работу человеческой нервной системы, особенностью которой является способность к самообучению с учетом предыдущего опыта. Таким образом, с каждым разом система совершает все меньше ошибок.Как и наша нервная система, нейросеть состоит из отдельных вычислительных элементов – нейронов, расположенных на нескольких слоях. Данные, поступающие на вход нейросети, проходят последовательную обработку на каждом слое сети. При этом каждый нейрон имеет определенные параметры, которые могут изменяться в зависимости от полученных результатов – в этом и заключается обучение сети.
Предположим, что задача нейросети – отличать кошек от собак. Для настройки нейронной сети подается большой массив подписанных изображений кошек и собак. Нейросеть анализирует признаки (в том числе линии, формы, их размер и цвет) на этих картинках и строит такую распознавательную модель, которая минимизирует процент ошибок относительно эталонных результатов.
На рисунке ниже представлен процесс работы нейросети, задача которой — распознать цифру почтового индекса, написанную от руки.
История нейросетей
Несмотря на то, что нейросети попали в центр всеобщего внимания совсем недавно, это один из старейших алгоритмов машинного обучения. Первая версия формального нейрона, ячейки нейронной сети, была предложена Уорреном Маккалоком и Уолтером Питтсом в 1943 году.А уже в 1958 году Фрэнк Розенблатт разработал первую нейронную сеть. Несмотря на свою простоту, она уже могла различать, например, объекты в двухмерном пространстве.
Mark I Perceptron — машина Розенблатта
Первые успехи привлекли повышенное внимание к технологии, однако затем другие алгоритмы машинного обучения стали показывать лучшие результаты, и нейросети отошли на второй план. Следующая волна интереса пришлась на 1990-е годы, после чего о нейросетях почти не было слышно до 2010 года.
Почему нейросети вновь популярны
До 2010 года попросту не существовало базы данных, достаточно большой для того, чтобы качественно обучить нейросети решать определенные задачи, в основном связанные с распознаванием и классификацией изображений. Поэтому нейросети довольно часто ошибались: путали кошку с собакой, или, что еще хуже, снимок здорового органа со снимком органа, пораженного опухолью.Но в 2010 году появилась база ImageNet, содержащая 15 миллионов изображений в 22 тысячах категорий. ImageNet многократно превышала объем существовавших баз данных изображений и была доступна для любого исследователя. С такими объемами данных нейросети можно было учить принимать практически безошибочные решения.
Размер ImageNet в сравнении с другими существовавшими в 2010 году базами изображений
До этого на пути развития нейросетей стояла другая, не менее существенная, проблема: традиционный метод обучения был неэффективен. Несмотря на то что важную роль играет число слоев в нейронной сети, важен также и метод обучения сети. Использовавшийся ранее метод обратного шифрования мог эффективно обучать только последние слои сети. Процесс обучения оказывался слишком длительным для практического применения, а скрытые слои глубинных нейросетей не функционировали должным образом.
Результатов в решении этой проблемы в 2006 году добились три независимых группы ученых. Во-первых, Джеффри Хинтон реализовал предобучение сети при помощи машины Больцмана, обучая каждый слой отдельно. Во-вторых, Ян ЛеКан предложил использование сверточной нейронной сети для решения проблем распознавания изображений. Наконец, Иошуа Бенджио разработал каскадный автокодировщик, позволивший задействовать все слои в глубокой нейронной сети.
Примеры успешного применения нейросетей в бизнесе
Медицина
Команда исследователей из Ноттингемского университета разработала четыре алгоритма машинного обучения для оценки степени риска сердечно-сосудистых заболеваний пациентов. Для обучения использовались данные 378 тыс. британских пациентов. Обученный искусственный интеллект определял риск кардиологических заболеваний эффективнее реальных врачей. Точность алгоритма — между 74 и 76,4 процентами (стандартная система из восьми факторов, разработанная Американской коллегией кардиологии, обеспечивает точность лишь в 72,8%).Финансы
Японская страховая компания Fukoku Mutual Life Insurance заключила контракт с IBM. Согласно нему, 34 сотрудников японской компании заменит система IBM Watson Explorer AI. Нейросеть будет просматривать десятки тысяч медицинских сертификатов и учитывать число посещений госпиталей, перенесенные операции и другие факторы для определения условий страхования клиентов. В Fukoku Mutual Life Insurance уверены, что использование IBM Watson повысит продуктивность на 30% и окупится за два года.Машинное обучение помогает распознавать потенциальные случаи мошенничества в различных сферах жизни. Подобный инструмент использует, например, PayPal – в рамках борьбы с отмыванием денег компания сравнивает миллионы транзакций и обнаруживает среди них подозрительные. В результате, мошеннические транзакции в PayPal составляют рекордно низкие 0,32%, тогда как стандарт в финансовом секторе — 1,32%.
Коммерция
Искусственный интеллект существенно улучшил механизмы рекомендаций в онлайн-магазинах и сервисах. Алгоритмы, основанные на машинном обучении, анализируют ваше поведение на сайте и сравнивают его с миллионами других пользователей. Все для того, чтобы определить, какой продукт вы купите с наибольшей вероятностью.Механизм рекомендаций обеспечивает Amazon 35% продаж. Алгоритм Brain, используемый YouTube для рекомендации контента, позволил добиться того, что практически 70% видео, просматриваемых на сайте, люди нашли благодаря рекомендациям (а не по ссылкам или подпискам). WSJ сообщало о том, что использование искусственного интеллекта для рекомендаций является одним из факторов, повлиявших на 10-кратный рост аудитории за последние пять лет.
Алгоритм Yandex Data Factory способен предсказывать влияние промоакций на объем продаж товаров. Анализируя историю продаж, а также тип и ассортимент магазина, алгоритм дал 87% точных (с точностью до коробки) и 61% ультраточных (с точностью до упаковки) прогнозов.
Нейросети, анализирующие естественный язык, могут использоваться для создания чат-ботов, позволяющих клиентам получить необходимую информацию о продуктах компании. Это позволит сократить издержки на команды колл-центров. Подобный робот уже работает в приемной Правительства Москвы и обрабатывает около 5% запросов. Бот способен подсказать, в том числе, расположение ближайшего МФЦ и график отключения горячей воды.
На технологии нейронных сетей также основана Albert – маркетинговая платформа полного цикла, самостоятельно осуществляющая практически все операции. Использующая ее компания-производитель нижнего белья Cosabella в итоге расформировала собственный отдел маркетинга и полностью доверилась платформе.
Транспорт
Беспилотные автомобили – концепт, над которым работает большинство крупных концернов, а также технологические компании (Google, Uber, Яндекс и другие) и стартапы, в своей работе опирается на нейросети. Искусственный интеллект отвечает за распознавание окружающих объектов – будь то другой автомобиль, пешеход или иное препятствие.Так видит наш мир нейросеть
Потенциал искусственного интеллекта в этой сфере не ограничивается автопилотом. Недавний опрос IBM показал: 74% топ-менеджеров автомобильной индустрии ожидают, что умные автомобили появятся на дорогах уже к 2025 году. Такие автомобили, интегрированные в Интернет вещей (см. наш предыдущий лонгрид), будут собирать информацию о предпочтениях пассажиров и автоматически регулировать температуру в салоне, громкость радио, положение сидений и другие параметры. Помимо пилотирования, система также будет информировать о возникающих проблемах (и даже попытается решить их сама) и ситуации на дороге.
Промышленность
Нейросеть, разработанная Марком Уоллером из Шанхайского Университета, специализируется на разработке синтетических молекул. Алгоритм составил шестистадийный синтез производного бензопирана сульфонамида (необходим при лечении Альцгеймера) всего за 5,4 секунды.Инструменты Yandex Data Factory помогают при выплавке стали: использующийся для производства стали металлический лом зачастую неоднороден по составу. Чтобы сталь соответствовала стандартам, при ее выплавке всегда нужно учитывать специфику лома и вводить специальные добавки. Этим обычно занимаются специально обученные технологи. Но, поскольку на таких производствах собирается много информации о поступающем сырье, применяемых добавках и результате, эту информацию с большей эффективностью способна обработать нейросеть. По данным Яндекса, внедрение нейросетей позволяет на 5% сократить расходы дорогих ферросплавов.
Аналогичным образом нейросеть способна помочь в переработке стекла. Сейчас это нерентабельный, хотя и полезный, бизнес, нуждающийся в государственных субсидиях. Использование технологий машинного обучения позволит значительно сократить издержки.
Сельское хозяйство
Инженеры Microsoft совместно с учеными из ICRISAT применяют искусственный интеллект, чтобы определить оптимальное время посева в Индии. Приложение, использующее Microsoft Cortana Intelligence Suite, также следит за состоянием почвы и подбирает необходимые удобрения. Изначально в программе участвовало всего лишь 175 фермеров из 7 деревень. Они начали посев только после соответствующего SMS уведомления. В результате, они собрали урожая на 30-40% больше, чем обычно.Развлечения и искусство
В прошлом году вышли и мгновенно стали популярными приложения, использующие нейросети для обработки фото и видео: MSQRD от белорусских разработчиков (в дальнейшем сервис выкупила Facebook), и российские Prisma и Mlvch. Другой сервис, Algorithmia, раскрашивает черно-белые фотографии.Яндекс успешно экспериментирует с музыкой: нейронные сети компании уже записали два альбома: в стиле Nirvana и “Гражданской обороны”. А музыка, написанная нейросетью под композитора-классика Александра Скрябина, была исполнена камерным оркестром, что заставляет вновь задуматься над вопросом о том, сможет ли робот сочинить симфонию. Нейросеть, созданная сотрудниками Sony, вдохновлялась Бахом.
Японский алгоритм написал книгу “День, когда Компьютер написал роман”. Несмотря на то что с характерами героев и сюжетными линиями неопытному писателю помогали люди, компьютер проделал огромную работу – в итоге одна из его работ прошла отборочный этап престижной литературной премии. Нейросети также написали продолжения к Гарри Поттеру и Игре Престолов.
В 2015 году нейросеть AlphaGo, разработанная командой Google DeepMind, стала первой программой, победившей профессионального игрока в го. А в мае этого года программа обыграла сильнейшего игрока в го в мире, Кэ Цзэ. Это стало прорывом, поскольку долгое время считалось, что компьютеры не обладают интуицией, необходимой для игры в го.
Безопасность
Команда разработчиков из Технологического университета Сиднея представила дронов для патрулирования пляжей. Основной задачей дронов станет поиск акул в прибрежных водах и предупреждение людей на пляжах. Анализ видеоданных производят нейросети, что существенно отразилось на результатах: разработчики утверждают о вероятности обнаружения и идентификации акул до 90%, тогда как оператор, просматривающий видео с беспилотников, успешно распознает акул лишь в 20-30% случаев.Австралия занимает второе место в мире после США по количеству случаев нападения акул на людей. В 2016 году в этой стране были зафиксированы 26 случаев нападения акул, два из которых закончились смертью людей.
В 2014 году Лаборатория Касперского сообщала, что их антивирус регистрирует 325 тыс. новых зараженных файлов ежедневно. В то же время, исследование компании Deep Instinct показало, что новые версии вирусов практически не отличаются от предыдущих – изменение составляет от 2% до 10%. Самообучающаяся модель, разработанная Deep Instinct, на основании этой информации способна с высокой точностью определять зараженные файлы.
Нейросети также способны искать определенные закономерности в том, как хранится информация в облачных сервисах, и сообщать об обнаруженных аномалиях, способных привести к бреши в безопасности.
Бонус: нейросети на страже нашего газона
В 2016 году 65-летний инженер NVIDIA Роберт Бонд столкнулся с проблемой: соседские кошки регулярно посещали его участок и оставляли следы своего присутствия, что раздражало его жену, работающую в саду. Бонд сразу отсек слишком недружелюбную идею соорудить ловушки для незваных гостей. Вместо этого он решил написать алгоритм, который бы автоматически включал садовые разбрызгиватели воды при приближении кошек.Перед Робертом стояла задача идентификации кошек в поступающем с внешней камеры видеопотоке. Для этого он использовал систему, основанную на популярной нейросети Caffe. Каждый раз, когда камера наблюдала изменение в обстановке на участке, она делала семь снимков и передавала их нейросети. После этого нейросеть должна была определить, присутствует ли в кадре кошка, и, в случае утвердительного ответа, включить разбрызгиватели.
Изображение с камеры во дворе Бонда
До начала работы нейросеть прошла обучение: Бонд “скормил” ей 300 разных фотографий кошек. Анализируя эти фотографии, нейросеть училась распознавать животных. Но этого оказалось недостаточно: она корректно определяла кошек лишь в 30% случаев и приняла за кошку тень Бонда, в результате чего он сам оказался мокрым.
Нейросеть заработала лучше после дополнительного обучения на большем количестве фотографий. Однако Бонд предупреждает, что нейросеть можно натренировать слишком сильно, в случае чего у нее сложится нереалистичный стереотип – например, если все снимки, использующиеся для обучения, сняты с одного ракурса, то искусственный интеллект может не распознать ту же самую кошку с другого угла. Поэтому чрезвычайно важным является грамотный подбор обучающего ряда данных.
Через некоторое время кошки, обучившиеся не на фотографиях, но на собственной шкуре, перестали посещать участок Бонда.
Заключение
Нейронные сети, технология середины прошлого века, сейчас меняет работу целых отраслей. Реакция общества неоднозначна: одних возможности нейросетей приводят в восторг, а других – заставляют усомниться в их пользе как специалистов.Однако не везде, куда приходит машинное обучение, оно вытесняет людей. Если нейросеть ставит диагнозы лучше живого врача, это не значит, что в будущем нас будут лечить исключительно роботы. Вероятнее, врач будет работать вместе с нейросетью. Аналогично, суперкомпьютер IBM Deep Blue выиграл в шахматы у Гарри Каспарова еще в 1997 году, однако люди из шахмат никуда не делись, а именитые гроссмейстеры до сих пор попадают на обложки глянцевых журналов.
Кооперация с машинами принесет гораздо больше пользы, чем конфронтация. Поэтому мы собрали список материалов в открытом доступе, которые помогут вам продолжить знакомство с нейросетями:
habr.com
Текущее положение машинного интеллекта (Machine Intelligence Landscape) - Наука, R&D, Искусственный интеллект, ИИ
Последние три месяца я провела, изучая каждый стартап, посвященный искусственному интеллекту, машинному обучению или обработке данных, который только можно было найти. На данный момент мой список насчитывает 2529 подобных стартапов. Да, мне следовало бы заниматься чем-то более интересным в вечернее время и по выходным, но все же…
Зачем это делать?
Несколько лет назад инвесторы и стартапы гонялись за big data (я помогала составить ландшафт отрасли). Сейчас мы видим похожий всплеск образования компаний, называющих себя искусственный интеллект, машинное обучение или что-то в этом роде – все вместе я называю это «машинный интеллект» (я поясню значение позже). Наш фонд Bloomberg Beta, который фокусируется на будущем разработок, инвестирует в подобные проекты. Я создала этот ландшафт, чтобы начать добавлять стартапы в контексте их направления – так гораздо проще обнаружить переполненные области и увидеть пробелы.
Что все-таки означает «машинный интеллект»?
Под машинным интеллектом я имею в виду термин, которым другие называют машинное обучение и искусственный интеллект. (Некоторые уже использовали этот термин прежде, не объясняя его и не понимая, сколько разговоров было о терминологии прежде.)
Я бы предпочла избежать новых терминов, но когда я пробовала употреблять «искусственный интеллект» или «машинное обучение», оба оказались слишком узконаправленными. Когда я говорила «искусственный интеллект», многие задавались вопросом, подходит ли эта компания под описание «истинного ИИ», когда я называла «машинное обучение», многие считали, что я несправедлива к большинству «ИИ-подобных» проектов как к разновидностям сферы глубокого изучения (deep learning). Народ сразу придумал «машинный интеллект» – так я и очутилась здесь.
Компьютеры обучаются думать, писать и читать. Они также перенимают сенсорные способности человека – возможность видеть и слышать (вероятно, в меньшей степени, осязать, чувствовать запах и вкус). Технологии машинного интеллекта охватывают огромный массив различных видов проблем (от классификации и кластеризации до обработки естественного языка и компьютерного видения) и методов (от машин опорных векторов до deep belief networks). Все эти технологии отражены в ландшафте.
Что этот ландшафт не включает, несмотря на всю важность, это технологии big data. Некоторые используют этот термин для обозначения все того же искусственного интеллекта и машинного обучения, но для своего ландшафта я хочу сфокусироваться на интеллектуальных методах, а не на данных, хранении и вычислительных кусочках головоломки (хотя, конечно, искусственный интеллект основан на обработке данных).
Какие компании составляют ландшафт?
Я учитывала тысячи компаний, но хотя график и переполнен, это всего лишь маленькая подгруппа огромной экосистемы. Критерии приема были на уровне тех, что устанавливают в Йельском университете или в Гарварде, и, возможно, настолько же произвольные.
Я постаралась включить компании, которые используют методы машинного интеллекта в качестве основной части своих технологий. Многие из этих компаний принадлежат сразу нескольким секторам, но ради упрощения я постаралась сохранить компании в их основной сфере и классифицировать в соответствии с тем, как они сами себя характеризуют (не придираясь к тому, действительно ли компания использует обработку естественного языка в соответствии со своим описанием).
Размышления о ландшафте
Недавно мы видели несколько отличных статей о том, почему машинный интеллект переживает возрождение, описывающие факторы, которые повлияли на этот процесс. (Кевин Келли, например, ведет подсчет дешевых систем параллельных вычислений, больших наборов данных и лучших алгоритмов). Я сфокусировалась на понимании экосистем на уровне «компания-компания» и составлении выводов из этого.
Да, это правда, машинный интеллект меняет корпорации, отрасли и людей в равной степени.
На высоком уровне легко понять, почему машинный интеллект так важен, но это не было так, пока я не выяснила, что на самом деле делают эти компании, и я начала обращать внимание на то, насколько они уже изменили мир вокруг нас.
Кевин Келли выразил это так: «Бизнес-планы следующих 10 000 стартапов легко предсказуемы: возьмите X и добавьте к нему ИИ».
Во многих случаях вам даже не нужно брать X – машинный интеллект непременно изменит существующие отрасли, но также создаст и совершенно новые.
Машинный интеллект приводит к созданию приложений, которых мы от него ожидаем, таких как автоматизированные помощники (Siri), восхитительные роботы (Jibo) и идентификация по фото (как высокоэффективное, но, к сожалению, названное DeepFace). Однако он также делает неожиданное: защищает детей от секс-трафика, уменьшает количество химикатов в латуке, который мы едим, помогает заказать через интернет туфли, которые идеально подходят к ступне, и разрушает видеоигры 80-х.
Многие компании будут приобретены.
Я была удивлена, обнаружив, что более 10 % подходящих (не публичных) компаний на слайде были приобретены. Это был абсолютный контраст со сферой больших данных, которую я исследовала, где в то время было всего несколько приобретений. Никто не удивится, если я раскрою, что главным покупателем стала Google, хотя в общей сложности было более 15 различных покупателей компаний из моего графика. По моим догадкам, к концу 2015 вторые 10 % будут раскуплены почти полностью. За мысли насчет того, какие именно из них будут раскуплены в следующем году, вам придется скрутить мне руку...
Но компании имеют непропорциональные преимущества, особенно те, которые изготавливают пользовательские продукты.
Гиганты поиска (Google, Baidu), социальные сети (Facebook, LinkedIn, Pinterest), контент (Netflix, Yahoo), мобильные устройства (Apple) и электронная коммерция (Amazon) находятся на невероятных позициях. В их распоряжении огромные наборы данных и постоянное взаимодействие с пользователями, что дает доступ к отзывам пользователей для усовершенствования их алгоритмов (и вместе эти факторы создают мощную сеть) – и им есть для чего использовать возможности, которые дает искусственный интеллект.
Лучшие в своем классе алгоритмы персонализации и рекомендации позволили этим компаниям достичь успеха (это одновременно впечатляет и обескураживает, когда Facebook предлагает добавить в друзья человека, в которого вы когда-то были влюблены в колледже, а Netflix подсовывает рекламу того самого идеального ситкома для вас). Сейчас они все сошлись в битве на новом поприще: переход на мобильные устройства. Завоевание этого сектора требует огромных ресурсов в области ИИ: высококлассный голосовой интерфейс (как Siri от Apple), визуальный поиск (FireFly от Amazon) и динамическая вопросно-ответная технология, которая предлагает вам правильные ответы вместо многочисленного набора ссылок (все поисковые компании стараются этого избежать). Крупные корпорации (IBM, Microsoft) также добились удивительных результатов в этой области, хоть у них и нет таких требований по взаимодействию с людьми, но они акцентируют свое внимание на областях предоставления знаний в больших отраслевых наборах данных, таких как приложение IBMWatson для помощи в диагностике больных.
Таланты в новой лиге ИИ.
Последние 20 лет большинство умов в области машинного интеллекта работали в научно-исследовательских институтах (особенно это касается продвинутых типов ИИ). Они разрабатывали новые виды машинного интеллекта, но всего лишь несколько из них получили применение в реальных условиях и имели практическую ценность.
Сейчас же приложения, использующие продвинутые методы машинного интеллекта, такие как deep belief networks и иерархические нейронные сети, начинают решать реальные мировые проблемы, и мы видим, как талантливые исследователи из академического мира перебираются в корпорации. Facebook наняла профессора из Нью-Йоркского университета Яна Лекуна (Yann LeCun) и Роба Фергюса (Rob Fergus) для работы в своей ИИ-лаборатории, Google наняла Джеффри Хинтона (Geoffrey Hinton) из университета Торонто, а Baidu переманила к себе Эндрю Ын (Andrew Ng). Важно знать, что они продолжают работать на академическое сообщество (одно из условий лаборатории Лекуна – продолжать работу над ключевыми исследованиями для сообщества, Хинтон тратит половину рабочего времени на преподавание, Ын сделал машинный интеллект более доступным с помощью Coursera). Но становится ясно, что большинство тяжеловесов постепенно покидают научно-исследовательский мир.
Для выдающихся умов области лаборатории корпораций предлагают не только хорошие зарплаты и доступ к «крестным отцам» отрасли, но и, что самое важное, доступ к данным. Эти лаборатории предоставляют ученым доступ к таким наборам данных, которых они ни за что не увидели бы в других местах (наборы данных ImageNet фантастические, но не сравнятся с тем, чем располагают Facebook, Google и Baidu).
В результате мы скоро станем свидетелями того, как корпорации становятся источником инноваций в области машинного интеллекта и нанимают все больше аспирантов и докторов наук, которые иначе остались бы в академическом мире.
Дивиденды мира.
Большие компании имеют неотъемлемое преимущество, и похоже, что те из них, кому удастся выиграть гонку машинного интеллекта, станут еще более могущественными. Однако хорошая новость для всего остального мира заключается в том, что ключевые технологии, которые они разработают, быстро распространятся на другие области благодаря уходу некоторых талантов и публикуемым исследованиям.
Аналогично с революцией в области big data, которая была вызвана выходом работ Google BigTable и BigQuery, мы увидим, как корпорации выпускают настолько же новаторские технологии в общество. Эти инновации будут адаптированы в новых отраслях и сферах применения, которые компании вроде Google не замечают или не хотят замечать.
Возможности для предпринимателей
«Моя компания занимается глубоким изучением в области X».
Эти несколько слов сделают вас более популярными в 2015. Конечно, в случае, если они будут достоверны. Глубокое изучение – золотая жила в области машинного интеллекта, которой уделяется больше всего внимания. Google, Facebook и Baidu достигли потрясающих результатов с методами решения задач визуального и голосового восприятия, как и стартапы вроде Enlitic, которые также показали многообещающие результаты.
Возможно, это станет затасканной фразочкой, вызывающей волнение от ожидаемых результатов и бизнес-моделей, но в отличие от большинства компаний, утверждающих, что они занимаются «big data», гораздо проще будет указать на суть, применив эту терминологию, если вы этим действительно занимаетесь. Наиболее впечатляющим в методах глубокого изучения является то, что, применяя их с должным уровнем осторожности, они могут заменить то, что называется интуицией, которая приходит из опыта применения функций автоматического обучения.
Как инвестор, который интересуется возможностями наискорейшего применения методов обработки данных и машинного обучения, я не имею времени ждать, чтобы увидеть, какие творческие проблемы пытаются решить практики глубокого изучения. Я полностью согласна с Джеффом Хоукинсом (Jeff Hawkins), когда он говорит, что большинство убойных приложений (killer applications), использующих эти технологии, подкрадутся незаметно. Я намереваюсь в полной мере сохранять разум открытым.
Acqui-hiring (поглощение ради найма сотрудников) как бизнес-модель.
Говорят, что ученые в сфере обработки данных являются единорогами из-за их нехватки. Однако на фоне нехватки талантов в области машинного интеллекта может показаться, что таких ученых в избытке. В области обработки данных у многих специалистов опыт работы в индустрии насчитывает десятки лет. Наиболее мощные работы в сфере машинного интеллекта проводились только в научно-исследовательских институтах. Такие таланты невозможно вырастить за одну ночь.
Такая нехватка талантов является благом для родоначальников индустрии, которые на самом деле понимают машинное обучение. Многие компании в сфере получат раннее финансирование, потому что уже есть признаки того, что эксперты в области машинного интеллекта обойдутся в пять раз дороже экспертов в других областях (возьмите, к примеру, Deep Mind, где цены за голову эксперта варьировались от $5 до $10 млн, если рассмотреть его в контексте acqui-hiring’а).
Многие друзья в шутку спрашивали меня: «Шивон, скажи, я должен просто собрать всех своих умных друзей в сфере ИИ и назвать это компанией?»
Если честно, я не знаю, что им на это ответить. (В Bloomberg Beta мы скорее станем поддерживать компании, строящиеся с долгосрочной перспективой, но это не значит, что это не станет прибыльной стратегией для многих предприимчивых основателей.)
Хороший демообразец представляет несоразмерно большую ценность в машинном интеллекте.
Я помню, как наблюдала за Watson, играющим в Jeopardy (телевизионная викторина). Когда он боролся в начале, я чувствовала искреннее сожаление. Когда он начал обыгрывать своих конкурентов, я заулыбалась, как будто это были Toronto Maple Leafs (хоккейный клуб НХЛ) в финале Кубка Стэнли. (Пояснение: 1) в то время я работала в IBM и испытывала склонность к своей команде; 2) Maple Leafs за всю мою жизнь ни разу не вышли в финал – пока – так что это было чисто гипотетически.)
Какое значение имеют все эти внушительные демонстрации? Последняя волна технологических компаний до первичного размещения (IPO) не имела демо, которые кто-нибудь мог бы оценить, так зачем они нужны компаниям в сфере машинного интеллекта? Последняя волна компаний была компьютероподобной: базы данных, корпоративные приложения и тому подобные. Конечно, я бы хотела видеть в 10 раз более производительные базы данных, но большинству все равно. Машинный интеллект выигрывает и проигрывает на демо вот почему: 1) технология очень человечна, чтобы вдохновить, вызвать шок или трепет; 2) бизнес-модели, как правило, требуют какое-то время, чтобы сформироваться, так что им нужно больше финансирования на долгосрочной основе, чтобы позволить определить свое направление; 3) они являются фантастическими приманками для поглощения. Watson побеждает лучших в своем деле людей в пустяках, несмотря на то что он думал, будто Торонто – это город в США. DeepMind отодвинул людей на задний план в состязаниях по видеоиграм, Vicarious распознал CAPTCHA. Есть еще несколько компаний, пока незаметных, которые обещают впечатлить еще больше, и я не могу дождаться, чтобы это увидеть.
Автор: Shivon Zilis
Перевод: Ксения Манасова
Оригинал фото: shivonzilis
json.tv
Машинный интеллект и реальный мир
В последние несколько лет я работаю исключительно с искусственным интеллектом. Я говорил с сотнями предпринимателей, исследователей и инвесторов о том, как помочь машинам сделать нас умнее.
Прошли месяцы с тех пор, как я поделился своими знаниями о компаниях, занимающихся искусственным интеллектом, а народ не переставал интересоваться, что лично я о них думаю — как будто они занимаются примерно одними и теми же вещами (Я полагаю, так люди говорили о сайтах «.com» в 1997).
В целом, люди больше всего озабочены тем, как взаимодействовать с этими технологиями, когда они выйдут в массы. Главная тема этой статьи — как такие компании выходят на рынок, а не методы, которые они используют.
В процессе написания статьи я заметил, что использую клички для компаний (довольно яркие). Это оказалось полезным, так что я постарался описать их наиболее подробно. Если вы наткнётесь на одну из них или вам понадобится удобный метод для своих описаний — уже есть подходящий язык.
Выделенные категории неточны — слишком уж комплексное пространство — но эта схема помогает нашему фонду (деньги из которого инвестируются в компании, занимающиеся улучшением рабочего процесса) разобраться что к чему, когда мы занимаемся предприятиями, разрабатывающими искусственный интеллект
Искусственный интеллект начинается с анализа данных, так что компании, которые я называю «паноптиконами», занимаются сбором массивов важных данных. Могущественные предприятия часто охватывают глобальную территорию. Слово «глобальный» в случае с компанией Planet Labs употребляется буквально, поскольку их спутники уже кружат над нашей планетой. Или же метафорически как в случае с компанием Premise, которая краудсорсит (краудсорсинг — привлечение широкой общественности через Интернет с целью исследования и решения общественных проблем — прим. Newочём) данные из множества стран.
С таким набором данных мы можем получить ответы на вопросы, на которые затруднялись ответить ранее. Рыночные барьеры не для слабаков, поскольку значительный объём данных собрать не так уж и просто.
Однако важно задаться вопросом, существует ли «достаточно хороший» набор данных, который станет более дешевой альтернативой, так как компании, лицензирующие данные, рискуют оказаться используемыми не по назначению. Компании, находящиеся в этом поле деятельности, должны быть уверены, что, либо (1) никто не способен или не будет способен собрать «достаточно хороший» набор данных, либо (2) они должны успешно захватить нишу развития искусственного интеллекта в придачу к своему набору данных и завладеть конечным пользователем.
Примеры компаний-«паноптиконов»: Planet Labs, Premise, Diffbot.
«Лазеры» собирают определенные наборы данных
Компании, которые я называю «лазерами», также занимаются сбором массивов данных, которые относятся к конкретным сферам и с чьей помощью внутриотраслевые проблемы решаются с точностью лазера. Их продукты нацелены на решение конкретных проблем пользователей, вроде: «Насколько интенсивно поливать семена?» или «Кому из кандидатов выдать кредит?». Эта категория может породить много, много компаний — сотни или даже больше — поскольку их продукты приобретают ценность с момента появления.
Такие технологии впервые позволят принимать решения во многих отраслях на основании только данных. Мы наблюдали за тем, как технологии помогали человечеству более эффективно питаться, улучшали медицинскую диагностику, поддерживали в проектах по сохранению природы и давали возможность высказаться тем, кто раньше не мог этого сделать.Но, чтобы добиться успеха, этим компаниям важно найти убийственный (в хорошем смысле) повод для применения данных и решить эту проблему так, чтобы упростить жизнь пользователям, а не усложнить ее.
Примеры компаний-«лазеров»: Tule Technologies, Enlitic, InVenture, Conservation Metrics, Red Bird, Mavrx, Watson Health.
«Алхимики» обещают превратить твои данные в золото
У этих компаний все просто: позвольте им работать с вашими данными и они превратят их в золото. Не создавая собственных баз данных, они пользуются новейшими алгоритмами для обогащения и получения уникальной информации из данных клиента. Существует три формы таких компаний:
- Самообслуживаемые решения на основе API.
- Сервисы, работающие с существующими наборами данных.
- Комплексные решения, предоставляющие собственные наборы, оптимизированные под конкретное железо.
Поскольку «алхимики» работают с массивами различных данных, они скорее всего рано получают возможность поработать с мощными приложениями искусственного интеллекта. Если они идут к клиентам напрямую и предлагают решения в практическом виде (т.е. выступают в качестве консультантов), то часто становятся доверенными партнерами.Но нужно быть осторожными. Эта отрасль находится на стадии зарождения, и те, кто пользуется подходом, основанным на API, с трудом смогут достичь больших результатов, так как доход приносит пока ещё незначительная база клиентов. Множество компаний с самообслуживанием перешли к более практической модели, чтобы решить эту проблему (и масштаб деятельность этих перенаселенных консалтинговых фирм иногда бывает очень сложно оценить).
Примеры компаний-«алхимиков»: Nervana Systems, Context Relevant, IBM Watson, Metamind, AlchemyAPI (acquired by IBM Watson), Skymind, Lucid.ai and Citrine.
«Врата» создают новые случаи применения, основываясь на сценических типах данных
Эти компании позволяют предприятиям получать доступ к уникальной информации, с чтением и интерпретацией которой они ранее испытывали проблемы (изображения, аудио, видео, информация генома). Они не собирают собственные данные, а используют те, что предоставляют клиенты или третьи лица. В отличие от «алхимиков», «врата» не работают с массивами различных типов данных и случаев, а специализируются в определенной сфере.
Что еще более замечательно, так это то, что это совершенно новый способ обращения с данными. Предприятия хоть и располагали этой информацией, но либо не хранили ее, либо не могли экономично интерпретировать. Сейчас эти «потерянные» данные могут быть использованы.
Но все же, стоит опасаться проблемы «и что?». Только потому, что мы обладаем методами для выделения новой уникальной информации, это не делает их ценными. Мы знакомы с компаниями, которые начинали с проблемы, которую нужно решить и были в итоге ослеплены магией метода решения. Последняя категория редко получает финансовую поддержку.
Примеры компаний-«врат»: Clarifai, Gridspace, Orbital Insight, Descartes Labs, Deep Genomics and Atomwise.
«Волшебные палочки» незаметно улучшают рабочий процесс
Это инструменты «программного обеспечения как услуги», которые делают работу более комфортной, не только вычленяя основную информацию из предоставленных вами данных, но и незаметно для вас внедряя ее в ваш ежедневный трудовой процесс. Здесь работа искусственного интеллекта кажется чистой магией. Они схожи с «лазерами» тем, что их интерфейс помогает пользователю решить конкретную проблему, но при этом склонны полагаться на данные пользователя или организации, а не создавать собственный набор данных с нуля.
Например, Textio — текстовый редактор, во время печатания советующий возможные улучшения в описаниях должностных обязанностей. С ним я могу с 40% заполненности описания дойти до 90% всего за несколько минут, все благодаря прекрасно реализованному алгоритму машинного обучения.
Я считаю, что через пять лет мы все будем использовать эти инструменты в разных ситуациях. Они позволяют пользователю мгновенно превращаться в эксперта, классифицируя для него полезные сведения, найденные в специфичных для данной области данных. Эти помощники могут накапливать информацию и тихонько переводить её в продукт. Мы ожидаем от этого сектора роста и ждем-не дождемся появления большего количества «волшебных палочек».
Риск в том, что человечество может утратить свои навыки, полагаясь на подобные инструменты (подобно тому, как автопилот создал риск утраты летчиком своих основных умений). Чтобы это предотвратить, создатели таких продуктов должны разработать пользовательский интерфейс таким образом, чтобы он укреплял знания пользователей, а не заменял их (например, обучая пользователя в процессе рекомендаций или используя двойной слепой метод).
Примеры: Textio, RelateIQ (приобретены Salesforce), InboxVudu, Sigopt и The Grid
«Навигаторы» создают автономные системы для физического мира
Искусственный интеллект играет огромную роль в реализации таких автономных технологий, как автомобили без водителей, беспилотники и роботы для улучшения работы на складах, в сельском хозяйстве и при уходе за пожилыми людьми. Эта категория — смесь компаний на ранних стадиях развития и гигантов вроде Google, Apple, Uber и Amazon.
Такие технологии дают нам возможность полностью изменить систему транспортировки и логистики, особенно в странах с формирующимся рынком, где еще нет развитой материальной инфраструктуры. Мы также можем использовать их для выполнения задач, всегда являвшихся очень опасными для людей.
Прежде чем заняться такими технологиями, компании должны быть уверены, что они смогут привлечь крупный капитал и нанять лучшие умы в одних из наиболее конкурентных областей. Многие задачи по работе с ИИ требуют участия экспертов разных специализаций — аппаратура, робототехника, аудио- и зрительное восприятие. Им также придется иметь дело с серьезными бюрократическими препонами (например, ограничения в отношении самоуправляемых автомобилей).
Примеры: Blue River Technologies, Airware, Clearpath Robotics, Kiva Systems (приобретены Amazon), 3DR, Skycatch, Cruise Automation и группы разработки самоуправляемых автомобилей в Google, Uber, Apple и Tesla.
«Агенты» создают киборгов и ботов для решения виртуальных заданий
Иногда лучший способ использования машинного интеллекта — это поставить его в пару с человеческим интеллектом. И киборги, и боты помогают вам выполнять некоторые задачи, но разница в том, что киборг будто притворяется человеком (он незримо совмещает человеческий и машинный интеллект, имеет свое личное имя и пытается общаться как человек), в то время как бот явно нечеловечен и полагается на ваше человеческое руководство в том, что же именно ему делать.
Киборги чаще всего выполняют сложные задания, например, работают с клиентами в онлайн-чате или планируют встречи через e-mail (например, Клара из Clara Labs или Эми из x.ai). Боты чаще помогают вам вести простые исследования, производить онлайн-транзакции и успешно справляться с командными задачами (например, Howdy — бот управления проектами).
В обоих случаях это идеальное сочетание людей и машин: компьютеры берут на себя рутинную транзакционную часть заданий и сотрудничают с нами в вопросах принятия сложных решений и применения творческого подхода.
Компании с упором на киборгов по большей части создаются как сервисы ручного управления, и со временем становятся более автоматизированными по мере развития технологий. Риск в том, успеют ли они совершить эту трансформацию достаточно быстро. И для ботов, и для киборгов сетевая анонимность будет оставаться проблемой, поскольку мы доверяем им все больше своих данных — календари, электронная почта, документы, кредитные карты.
Примеры: Clara, x.ai, Facebook M, Digital Genius, Kasisto и Howdy.
«Первопроходцы» очень умные
Некоторые компании в сфере искусственного интеллекта начинают свое существование как университетские проекты. Когда команды разработчиков — профессора и аспиранты с многолетним опытом работы в своей области — обнаруживают, что у них на руках есть прибыльный продукт, они (или их университеты) раскручивают эти проекты до коммерческих компаний.
Именно эти команды решают проблемы, кажущиеся нерешаемыми. Собрать такую команду — само по себе жизнеспособная рыночная стратегия, поскольку в этой области так мало людей с опытом 8–10 лет. Их умы настолько ценны, что инвесторы готовы рисковать ради одной лишь команды — даже если бизнес-модель еще требует доработки.
На самом деле существует множество крайне важных проблем, требующих решения и не дающих краткосрочных результатов. Эти команды щелкают их как семечки, и они — одни из немногих, кто потенциально может сделать самые фантастичные идеи реальностью!
Этот подход даст отличные результаты, если у команды есть проблема, работе над которой они по-настоящему преданы, но их трудно удержать вместе, если они сплачиваются только из солидарности или из-за надежды на покупку всей компании с целью приобретения ценного коллектива сотрудников. Им также нужны спонсоры, разделяющие их долгосрочное видение проблемы.
Примеры: DeepMind (приобретены Google), DNN Research (приобретены Google), Numenta, Vicarious, NNaiSense и Curious AI.
Как можно увидеть, совершенно ясно, что искусственный интеллект — очень активная сфера. Существует много компаний, не подходящих под эти категории, но перечисленные мы видим чаще всего.
Очевидный вопрос по всем этим категориям: какие из них привлекательнее всего для инвестиций? Индивидуальные стартапы изначально стоят особняком, поэтому трудно поделить все на черное и белое, но мы так увлечены этим сектором, что на самом деле все зависит от степени оптимизма. Лично меня особенно радуют «лазеры» и «волшебные палочки», потому что они могут превратить новые виды данных в реализуемый интеллект прямо сейчас, а также извлечь пользу из испытанных технологий «программного обеспечения как услуги».
Дальше будет больше. Оставайтесь с нами.
Автор: Шивон Зилис.Оригинал: TechCrunch.
Перевели: Александр Поздеев, Кирилл Козловский.Редактировали: Анна Небольсина, Поликарп Никифоров.
newochem.ru
Машинный интеллект и реальный мир
Шивон Зилис, один из инвесторов венчурного фонда Bloomberg Beta с капиталом в 75 миллионов долларов, в последнее время инвестирует в компании, занимающиеся исключительно искусственным интеллектом. Шимон рассуждает, как такие компании выходят на рынок, и классифицирует их по роду деятельности.
В последние несколько лет я работаю исключительно с искусственным интеллектом. Я говорил с сотнями предпринимателей, исследователей и инвесторов о том, как помочь машинам сделать нас умнее.
Прошли месяцы с тех пор, как я поделился своими знаниями о компаниях, занимающихся искусственным интеллектом, а народ не переставал интересоваться, что лично я о них думаю — как будто они занимаются примерно одними и теми же вещами (Я полагаю, так люди говорили о сайтах «.com» в 1997).
В целом, люди больше всего озабочены тем, как взаимодействовать с этими технологиями, когда они выйдут в массы. Главная тема этой статьи — как такие компании выходят на рынок, а не методы, которые они используют.
В процессе написания статьи я заметил, что использую клички для компаний (довольно яркие). Это оказалось полезным, так что я постарался описать их наиболее подробно. Если вы наткнётесь на одну из них или вам понадобится удобный метод для своих описаний — уже есть подходящий язык.
Выделенные категории неточны — слишком уж комплексное пространство — но эта схема помогает нашему фонду (деньги из которого инвестируются в компании, занимающиеся улучшением рабочего процесса) разобраться что к чему, когда мы занимаемся предприятиями, разрабатывающими искусственный интеллект.
«Паноптиконы» собирают обширные массивы данных
Искусственный интеллект начинается с анализа данных, так что компании, которые я называю «паноптиконами», занимаются сбором массивов важных данных. Могущественные предприятия часто охватывают глобальную территорию. Слово «глобальный» в случае с компанией Planet Labs употребляется буквально, поскольку их спутники уже кружат над нашей планетой. Или же метафорически как в случае с компанием Premise, которая краудсорсит данные из множества стран.
С таким набором данных мы можем получить ответы на вопросы, на которые затруднялись ответить ранее. Рыночные барьеры не для слабаков, поскольку значительный объём данных собрать не так уж и просто.
Однако важно задаться вопросом, существует ли «достаточно хороший» набор данных, который станет более дешевой альтернативой, так как компании, лицензирующие данные, рискуют оказаться используемыми не по назначению. Компании, находящиеся в этом поле деятельности, должны быть уверены, что, либо (1) никто не способен или не будет способен собрать «достаточно хороший» набор данных, либо (2) они должны успешно захватить нишу развития искусственного интеллекта в придачу к своему набору данных и завладеть конечным пользователем.
Примеры компаний-«паноптиконов»: Planet Labs, Premise, Diffbot.
«Лазеры» собирают определенные наборы данных
Компании, которые я называю «лазерами», также занимаются сбором массивов данных, которые относятся к конкретным сферам и с чьей помощью внутриотраслевые проблемы решаются с точностью лазера. Их продукты нацелены на решение конкретных проблем пользователей, вроде: «Насколько интенсивно поливать семена?» или «Кому из кандидатов выдать кредит?». Эта категория может породить много, много компаний — сотни или даже больше — поскольку их продукты приобретают ценность с момента появления.
Такие технологии впервые позволят принимать решения во многих отраслях на основании только данных. Мы наблюдали за тем, как технологии помогали человечеству более эффективно питаться, улучшали медицинскую диагностику, поддерживали в проектах по сохранению природы и давали возможность высказаться тем, кто раньше не мог этого сделать.
Но, чтобы добиться успеха, этим компаниям важно найти убийственный (в хорошем смысле) повод для применения данных и решить эту проблему так, чтобы упростить жизнь пользователям, а не усложнить ее.
Примеры компаний-«лазеров»: Tule Technologies, Enlitic, InVenture, Conservation Metrics, Red Bird, Mavrx, Watson Health.
«Алхимики» обещают превратить твои данные в золото
У этих компаний все просто: позвольте им работать с вашими данными и они превратят их в золото. Не создавая собственных баз данных, они пользуются новейшими алгоритмами для обогащения и получения уникальной информации из данных клиента. Существует три формы таких компаний:
- Самообслуживаемые решения на основе API.
- Сервисы, работающие с существующими наборами данных.
- Комплексные решения, предоставляющие собственные наборы, оптимизированные под конкретное железо.
Поскольку «алхимики» работают с массивами различных данных, они скорее всего рано получают возможность поработать с мощными приложениями искусственного интеллекта. Если они идут к клиентам напрямую и предлагают решения в практическом виде (т.е. выступают в качестве консультантов), то часто становятся доверенными партнерами. Но нужно быть осторожными. Эта отрасль находится на стадии зарождения, и те, кто пользуется подходом, основанным на API, с трудом смогут достичь больших результатов, так как доход приносит пока ещё незначительная база клиентов. Множество компаний с самообслуживанием перешли к более практической модели, чтобы решить эту проблему (и масштаб деятельность этих перенаселенных консалтинговых фирм иногда бывает очень сложно оценить).
Примеры компаний-«алхимиков»: Nervana Systems, Context Relevant, IBM Watson, Metamind, AlchemyAPI (acquired by IBM Watson), Skymind, Lucid.ai and Citrine.
«Врата» создают новые случаи применения, основываясь на сценических типах данных
Эти компании позволяют предприятиям получать доступ к уникальной информации, с чтением и интерпретацией которой они ранее испытывали проблемы (изображения, аудио, видео, информация генома). Они не собирают собственные данные, а используют те, что предоставляют клиенты или третьи лица. В отличие от «алхимиков», «врата» не работают с массивами различных типов данных и случаев, а специализируются в определенной сфере.
Что еще более замечательно, так это то, что это совершенно новый способ обращения с данными. Предприятия хоть и располагали этой информацией, но либо не хранили ее, либо не могли экономично интерпретировать. Сейчас эти «потерянные» данные могут быть использованы.
Но все же, стоит опасаться проблемы «и что?». Только потому, что мы обладаем методами для выделения новой уникальной информации, это не делает их ценными. Мы знакомы с компаниями, которые начинали с проблемы, которую нужно решить и были в итоге ослеплены магией метода решения. Последняя категория редко получает финансовую поддержку.
Примеры компаний-«врат»: Clarifai, Gridspace, Orbital Insight, Descartes Labs, Deep Genomics and Atomwise.
«Волшебные палочки» незаметно улучшают рабочий процесс
Это инструменты «программного обеспечения как услуги», которые делают работу более комфортной, не только вычленяя основную информацию из предоставленных вами данных, но и незаметно для вас внедряя ее в ваш ежедневный трудовой процесс. Здесь работа искусственного интеллекта кажется чистой магией. Они схожи с «лазерами» тем, что их интерфейс помогает пользователю решить конкретную проблему, но при этом склонны полагаться на данные пользователя или организации, а не создавать собственный набор данных с нуля.
Например, Textio — текстовый редактор, во время печатания советующий возможные улучшения в описаниях должностных обязанностей. С ним я могу с 40% заполненности описания дойти до 90% всего за несколько минут, все благодаря прекрасно реализованному алгоритму машинного обучения.
Я считаю, что через пять лет мы все будем использовать эти инструменты в разных ситуациях. Они позволяют пользователю мгновенно превращаться в эксперта, классифицируя для него полезные сведения, найденные в специфичных для данной области данных. Эти помощники могут накапливать информацию и тихонько переводить её в продукт. Мы ожидаем от этого сектора роста и ждем-не дождемся появления большего количества «волшебных палочек».
Риск в том, что человечество может утратить свои навыки, полагаясь на подобные инструменты (подобно тому, как автопилот создал риск утраты летчиком своих основных умений). Чтобы это предотвратить, создатели таких продуктов должны разработать пользовательский интерфейс таким образом, чтобы он укреплял знания пользователей, а не заменял их (например, обучая пользователя в процессе рекомендаций или используя двойной слепой метод).
Примеры: Textio, RelateIQ (приобретены Salesforce), InboxVudu, Sigopt и The Grid
«Навигаторы» создают автономные системы для физического мира
Искусственный интеллект играет огромную роль в реализации таких автономных технологий, как автомобили без водителей, беспилотники и роботы для улучшения работы на складах, в сельском хозяйстве и при уходе за пожилыми людьми. Эта категория — смесь компаний на ранних стадиях развития и гигантов вроде Google, Apple, Uber и Amazon.
Такие технологии дают нам возможность полностью изменить систему транспортировки и логистики, особенно в странах с формирующимся рынком, где еще нет развитой материальной инфраструктуры. Мы также можем использовать их для выполнения задач, всегда являвшихся очень опасными для людей.
Прежде чем заняться такими технологиями, компании должны быть уверены, что они смогут привлечь крупный капитал и нанять лучшие умы в одних из наиболее конкурентных областей. Многие задачи по работе с ИИ требуют участия экспертов разных специализаций — аппаратура, робототехника, аудио- и зрительное восприятие. Им также придется иметь дело с серьезными бюрократическими препонами (например, ограничения в отношении самоуправляемых автомобилей).
Примеры: Blue River Technologies, Airware, Clearpath Robotics, Kiva Systems (приобретены Amazon), 3DR, Skycatch, Cruise Automation и группы разработки самоуправляемых автомобилей в Google, Uber, Apple и Tesla.
«Агенты» создают киборгов и ботов для решения виртуальных заданий
Иногда лучший способ использования машинного интеллекта — это поставить его в пару с человеческим интеллектом. И киборги, и боты помогают вам выполнять некоторые задачи, но разница в том, что киборг будто притворяется человеком (он незримо совмещает человеческий и машинный интеллект, имеет свое личное имя и пытается общаться как человек), в то время как бот явно нечеловечен и полагается на ваше человеческое руководство в том, что же именно ему делать.
Киборги чаще всего выполняют сложные задания, например, работают с клиентами в онлайн-чате или планируют встречи через e-mail (например, Клара из Clara Labs или Эми из x.ai). Боты чаще помогают вам вести простые исследования, производить онлайн-транзакции и успешно справляться с командными задачами (например, Howdy — бот управления проектами).
В обоих случаях это идеальное сочетание людей и машин: компьютеры берут на себя рутинную транзакционную часть заданий и сотрудничают с нами в вопросах принятия сложных решений и применения творческого подхода.
Компании с упором на киборгов по большей части создаются как сервисы ручного управления, и со временем становятся более автоматизированными по мере развития технологий. Риск в том, успеют ли они совершить эту трансформацию достаточно быстро. И для ботов, и для киборгов сетевая анонимность будет оставаться проблемой, поскольку мы доверяем им все больше своих данных — календари, электронная почта, документы, кредитные карты.
Примеры: Clara, x.ai, Facebook M, Digital Genius, Kasisto и Howdy.
«Первопроходцы» очень умные
Некоторые компании в сфере искусственного интеллекта начинают свое существование как университетские проекты. Когда команды разработчиков — профессора и аспиранты с многолетним опытом работы в своей области — обнаруживают, что у них на руках есть прибыльный продукт, они (или их университеты) раскручивают эти проекты до коммерческих компаний.
Именно эти команды решают проблемы, кажущиеся нерешаемыми. Собрать такую команду — само по себе жизнеспособная рыночная стратегия, поскольку в этой области так мало людей с опытом 8–10 лет. Их умы настолько ценны, что инвесторы готовы рисковать ради одной лишь команды — даже если бизнес-модель еще требует доработки.
На самом деле существует множество крайне важных проблем, требующих решения и не дающих краткосрочных результатов. Эти команды щелкают их как семечки, и они — одни из немногих, кто потенциально может сделать самые фантастичные идеи реальностью!
Этот подход даст отличные результаты, если у команды есть проблема, работе над которой они по-настоящему преданы, но их трудно удержать вместе, если они сплачиваются только из солидарности или из-за надежды на покупку всей компании с целью приобретения ценного коллектива сотрудников. Им также нужны спонсоры, разделяющие их долгосрочное видение проблемы.
Примеры: DeepMind (приобретены Google), DNN Research (приобретены Google), Numenta, Vicarious, NNaiSense и Curious AI.
Как можно увидеть, совершенно ясно, что искусственный интеллект — очень активная сфера. Существует много компаний, не подходящих под эти категории, но перечисленные мы видим чаще всего.
Очевидный вопрос по всем этим категориям: какие из них привлекательнее всего для инвестиций? Индивидуальные стартапы изначально стоят особняком, поэтому трудно поделить все на черное и белое, но мы так увлечены этим сектором, что на самом деле все зависит от степени оптимизма. Лично меня особенно радуют «лазеры» и «волшебные палочки», потому что они могут превратить новые виды данных в реализуемый интеллект прямо сейчас, а также извлечь пользу из испытанных технологий «программного обеспечения как услуги».
Дальше будет больше. Оставайтесь с нами.
Источник
Читайте и смотрите также:
fastsalttimes.com
Машинный интеллект в клавиатуре Gboard / Хабр
Учитывая факт, что мобильная клавиатура преобразует прикосновения в текст примерно так же, как система распознавания речи транслирует голос в текст, мы применили систему Speech Recognition. Сначала мы создали надёжные пространственные модели, которые сопоставляют нечёткие последовательности прикосновений к таскрину с клавишами клавиатуры, точно как акустические модели сопоставляют последовательности звуковых фрагментов с фонетическими единицами. Затем мы создали мощный движок декодирования, основанный на конечных преобразователях (FST) для определения самой вероятной фразы для данной последовательности прикосновений. Мы знали, что с его математическим формализмом и широким успехом в голосовых приложениях FST-декодер обеспечит необходимую гибкость для поддержки всего разнообразия сложных вариантов ввода, а также языковые функции. В данной статье мы расскажем подробно, что входило в разработку обеих этих систем.
Нейронные пространственные модели
Ввод с мобильной клавиатуры подвержен ошибкам, которые обычно называют «толстый палец» (или трассировка пространственно похожих слов в скользящем наборе, как показано ниже), а также ошибкам моторики и когнитивным ошибкам (что проявляется в опечатках, вставке лишних символов, пропущенных символах или перемене символов местами). Умная клавиатура должна учитывать эти ошибки и предсказывать подразумеваемое слово быстро и точно. По существу, мы создали пространственную модель для Gboard, которая устраняет эти ошибки на уровне символов, сопоставляя точки прикосновения на экране с реальными клавишами.Средняя траектория для двух пространственно похожих слов: “Vampire” и “Value”До недавнего времени в Gboard использовались 1) гауссовская модель для определения вероятности нажатия соседних клавиш; 2) основанная на правилах модель для представления ошибок моторики и когнитивных ошибок. Эти модели были простыми и интуитивными, но не позволяли напрямую оптимизировать метрики, которые коррелируют с лучшим качеством набора. Опираясь на наш опыт с акустическими моделями Voice Search, мы заменили и гауссовую модель, и основанную на правилах модель на единственную высокоэффективную модель долгой краткосрочной памяти (LSTM), обученную с критерием ассоциативной скоротечной классификации (connectionist temporal classification, CTC).
Однако обучение этой модели оказалось гораздо сложнее, чем мы предполагали. В то время как акустические модели обучались на аудиоданных с сопроводительным текстом, подготовленным человеком, было сложно подготовить сопроводительный текст для миллионов последовательностей нажатий на тачскрин и траекторий движения пальцев по клавиатуре. Так что разработчики использовали сигналы взаимодействия от самих пользователей — исправленные автокоррекции и выборы подсказок — как негативные и положительные сигналы в обучении с частичным привлечением учителя (semi-supervised learning). Так были сформированы обширные наборы данных для обучения и тестирования.
Исходные точки данных, соответствующие слову “could” (слева) и нормализованные отобранные траектории с отклонениями по выборке (справа)
Методом перебора было испробовано множество техник из литературы по распознаванию речи на нейронных пространственных моделях (NSM), чтобы сделать их достаточно компактными и быстрыми для работы на любом устройстве. Сотни моделей обучались на инфраструктуре TensorFlow, оптимизируя различные сигналы с клавиатуры: автодополнения, подсказки, скольжения по тачскрину и др. После более года работы готовые модели стали примерно в 6 раз быстрее и в 10 раз компактнее, чем исходные версии. У них также примерно на 15% сократилось количество неправильных автоисправлений и на 10% уменьшилось количество неправильно распознанных жестов на офлайновых наборах данных.
Конечные преобразователи
В то время как NSM используют пространственную информацию для помощи в определении нажатий клавиш или траекторий движения по клавиатуре, существуют и дополнительные ограничения языка — лексические и грамматические — которые можно использовать. Лексикон говорит нам, какие слова существуют в языке, а вероятностная грамматика — какие слова могут последовать за какими другими. Для кодирования этой информации мы использовали конечные преобразователи (FST). Они давно были ключевым компонентом систем распознавания и синтеза речи Google. FST обеспечивают принципиальный способ представления различных вероятностных моделей (лексиконы, грамматики, нормализаторы и др.) из обработки естественного языка, а также математический фреймворк, необходимый для воздействия, оптимизации, комбинирования и поиска моделей*.В Gboard преобразователь символов в слова компактно представляет собой лексикон клавиатуры, как показано на иллюстрации внизу. Он кодирует способы преобразования последовательностей клавиш в слова, допуская альтернативные последовательности клавиш и произвольные пробелы.
Преобразователь кодирует “I”, “I’ve”, “If” вдоль траекторий от начального состояния (жирный круг с обозначением «1») до конечных состояний (круги в двойном контуре с обозначениями «0» и «1»). Каждая дуга помечена входным значением клавиши (перед двоеточием) и соответствующим результирующим словом (после двоеточия), где ε обозначает пустой символ. Апостроф в “I’ve” может быть опущен. Пользователь иногда может упустить простановку пробела. Чтобы учитывать это, в преобразователе пробел между словами является необязательным. Символ ε и обратные дуги допускают более одного слова.Вероятностный преобразователь n-грамм используется для представления языковой модели для клавиатуры. Состояние в модели представляет (до) n-1 словарный контекст. Выходящая из этого состояния дуга помечена словом-победителем и вероятностью, с которой оно следует за этим контекстом (исходя из текстовых данных). В сочетании с пространственной моделью, которая выдаёт вероятности последовательностей нажатий по клавишам (дискретные значения в случае отдельных нажатий или непрерывные жесты в скользящем наборе), такая модель используется в алгоритме лучевого поиска.
Общие принципы FST — стриминг, поддержка динамических моделей и прочие — позволили далеко продвинуться в разработке нового декодера клавиатуры. Но необходимо было добавить несколько дополнительных функций. Когда вы говорите вслух, вам не требуется декодер, чтобы догадаться об окончании слова или следующем слове — и сэкономить несколько слогов в речи; но когда вы печатаете, то помощь в автодополнениях и предсказаниях окажется весьма кстати. Также мы хотели, чтобы клавиатура обеспечивала органичную многоязыковую поддержку, как показано ниже.
Трёхъязычный набор в Gboard.
Понадобились сложные усилия, чтобы новый декодер заработал, но принципиальная природа конечных преобразователей имеет много преимуществ. Например, поддержка транслитераций для языков вроде хинди — это простое расширение к базовому декодеру.
Модели транслитерации
Во многих языках со сложными алфавитами были разработаны системы романизации для отображения символов в латинском алфавите, часто в соответствии с их фонетическими произношениями. Например, пиньиньское “xièxiè” соответствует китайским символам “谢谢”(«спасибо»). Пиньиньская клавиатура позволяет удобно набирать слова в раскладке QWERTY и автоматически «переводить» их на нужный алфавит. Таким же способом клавиатура хинди позволяет набрать “daanth” для слова “दांत” («зуб»). В то время как у пиньиня есть общепринятая система романизации, транслитерация хинди не такая ясная. Например, “daant” тоже будет допустимой альтернативой для “दांत”.Транслитерация скользящего ввода на хинди
Когда у нас был преобразователь, который преобразует последовательности букв в слова (лексикон) и автоматическая взвешенная языковая модель для последовательностей слов, мы разработали взвешенный преобразователь для преобразования между латинскими последовательностями символов и алфавитами 22 индийских языков. В некоторых языках есть несколько письменностей (например, язык бодо можно записывать бенгальским письмом или на девангари), так что между транслитерацией и нативным написанием мы создали 57 методов ввода всего за несколько месяцев.
Универсальная природа декодера FST позволила нам использовать всю работу, проделанную ранее, для поддержки автодополнений, предсказаний, скользящего набора и многих функций UI без каких-либо дополнительных усилий, так что наши индийские пользователи с самого начала получили отличное качество программы.
Более умная клавиатура
В целом, наша последняя работа позволила сократить задержку декодирования на 50%, уменьшила долю слов, которые пользователям приходилось исправлять вручную, на 10%, позволила запустить транслитерацию для 22 официальных языков Индии и привела к появлению многих новых функций, которые вы могли заметить.Надеемся, что последние изменения помогут вам набирать текст на клавиатуре мобильного устройства. Но мы понимаем, что эта задача ни в коем случае не решена. Gboard по-прежнему может делать предположения, которые кажутся странными или малополезными, а жесты могут распознаваться в слова, которые человек никогда бы не набрал. Однако наш переход к мощным алгоритмам машинного интеллекта открывает новые возможности, которые мы активно изучаем, чтобы создавать более полезные инструменты и продукты для наших пользователей по всему миру.
Благодарности
Эту работу проделали Кирилл Аллаузен, Уайс Альшариф, Ларс Хеллстен, Том Оуян, Брайан Роарк и Дэвид Рыбач, при содействии группы Speech Data Operation. Особая благодарность Йохану Шалквику и Коринне Кортес за их помощь.* Набор соответствующих алгоритмов доступен в свободной библиотеке OpenFst. ↑
habr.com