Роботы андроиды: настоящее и будущее / Хабр

Содержание

Эффект зловещей долины: почему нас пугают роботы-андроиды

Когда «Алиса» выдает фразу в тему, это весело. Но если робот обретает «плоть и кровь», улыбается и общается почти как человек, нам становится не по себе. РБК Тренды разобрались, почему так происходит и как это исправить

В чем суть «эффекта зловещей долины»

«Эффект зловещей долины» — это гипотеза о том, что робот или любой другой объект, который выглядит или ведет себя как человек, вызывает неприязнь и отвращение у людей-наблюдателей. Пугает не само сходство, а любое отклонение от нормы в поведении — например, заторможенная мимика.

Китайские роботы, помогающие лечить больных коронавирусом

Впервые об «эффекте зловещей долины» заговорил японский ученый-робототехник Масахиро Мори. В 1970 году он написал эссе Bukimi No Tani, а через восемь лет название его работы перевели на английский как Uncanny Valley («Зловещая долина»). Мори выдвинул идею: чем сильнее мы будем стараться, чтобы роботы были похожи на людей, тем больше отторжения они будут вызывать. Это будет происходить, пока не удастся преодолеть гипотетический провал, обозначенный как «зловещая долина». Для наглядности ученый создал график того, как может выглядеть этот путь развития человекоподобных роботов.

Серым цветом обозначена зона «зловещей долины», когда робот выглядит настолько похожим на человека, что становится ему неприятен. Эффект исчезнет, если андроид станет абсолютно идентичен человеку.

(Фото: wikipedia.org)

С момента выхода эссе Мори ученые неоднократно проводили исследования, чтобы подтвердить или опровергнуть гипотезу. Например, в Индианском университете опросили группу людей, предлагая оценить андроидов разной степени «человечности». Большинство исследователей сходились во мнении, что говорить об эффекте зловещей долины еще рано: нет достаточных доказательств. Но с 2018 года эффект стал подтверждаться все чаще. Например, в публикации Хельсинкского университета было обозначено, что явление стало более устойчивым. Перейти эту «долину» до сих пор не смог ни один робот.

Какие роботы вызывают «эффект зловещей долины»

Не каждый андроид способен довести до мурашек. Чтобы это произошло, мы должны подсознательно поверить, что перед нами человек. Тогда любая его оплошность — неестественная речь, дерганная улыбка или странное выражение эмоций — может привести к «эффекту зловещей долины».

Евгений Магид, профессор Казанского федерального университета, руководитель Лаборатории интеллектуальных робототехнических систем (ЛИРС), PhD:

«Набор винтиков, датчиков и программ не вызывает у нас страха и недоверия — такой робот не выглядит как человек. Мы не ожидаем от него сногсшибательных успехов или подвохов. Зато роботы, которые близко подошли к нам по внешнему виду и интеллектуальным способностям, например геминоиды (роботы, имитирующие человеческую внешность. — РБК Тренды) гения XX века профессора Хироси Исигуро или робот София вызывают ту самую смесь разочарования, страха и недоверия, опуская нас на самое дно «зловещей долины».

Одного из самых реалистичных роботов в мире Geminoid DK вполне можно перепутать с человеком, если увидеть его на фото. Но в движении его мимика может создать жутковатые ощущения.

Geminoid DK разработан профессором Университета Осаки Хироши Исигуро вместе с коллегами из Японского научно-исследовательского института международных телекоммуникаций

Кроме того, «эффект зловещей долины» могут вызывать:

  • застывшее лицо: если андроид выглядит очень реалистично — вплоть до родинок и капель пота на лбу, но при этом закрыл глаза и не двигается, наша психика может решить, что перед нами труп;
  • артикуляция речи: когда робот не проговаривает слова ртом, кажется, что они доносятся откуда-то извне;
  • дерганные движения, нереалистичные эмоции;
  • неестественная механическая речь.

Интеллектуальный робот BINA48 может поддержать разговор на сложные темы, почти как настоящий человек. При этом его речь звучит механически, что может отталкивать людей

Немецкие ученые нашли область мозга, которая отвечает за «эффект зловещей долины». Она находится в префронтальной коре — той зоне, благодаря которой человек может размышлять. Одна часть коры пытается отделить людей от не людей, а другая, исходя из этого, оценивает, приятен ли мозгу этот субъект. Это значит, что, если однажды ученые создадут робота, которого мозг не сможет отличить от человека, «эффект зловещей долины» не возникнет.

Почему нас пугают антропоморфные роботы

Ученые до сих пор расходятся во мнениях, почему мы испытываем смешанные чувства к человекоподобным роботам. Разберем основные причины.

Влияние теории восприятия угрозы. Люди подсознательно чувствуют угрозу от неизвестного им объекта. Историк Минсу Канг предположил, что из-за этого может возникать когнитивный диссонанс при виде андроида. С одной стороны, он выглядит и ведет себя как человек, с другой — сохраняет повадки машины. Непонятно, к какой категории относить такого реалистичного робота, — отсюда тревога и неприязнь.

Невозможность сопереживать. Люди привыкли проявлять эмпатию к живым существам. Для этого им нужно распознать их эмоции и сопоставить со своими. Но не все проявления в поведении и речи робота возможно идентифицировать. В результате люди испытывают тревогу: кажется, что рушится контроль над ситуацией. Такую гипотезу выдвинула исследовательница Катрин Миссельхорн. По ее мнению, из-за невозможности сопереживать роботу сильнее всего «эффект зловещей долины» чувствуется, когда андроид стоит совсем близко к нам.

Невозможность получить адекватную обратную реакцию. Ученая Анжела Тинвелл считает, что проблема не в том, что люди не могут сопереживать роботу, а в том, что он сам не может проявлять эмпатию. Если живое существо, похожее на человека, неспособно к обратному эмоциональному отклику — например, не может рассмеяться над вашей шуткой или кивнуть головой, когда вы рассказываете историю, — это пугает. Люди могут воспринять такого робота как психопата, который может сделать все что угодно, ведь эмоции ему чужды.

Евгений Магид:

«Во-первых, у пользователей слишком большие ожидания, которые роботы пока не в состоянии оправдать. Они общаются с роботом как с живым человеком. Но технологии еще далеки от успехов природы, поэтому первое чувство восторга постепенно сменяется разочарованием и отвращением. Все как в жизни, когда человек не оправдал доверия.

Во-вторых, подсознательно люди могут чувствовать страх. Они боятся, например, что робот опасен для их жизни и здоровья, может отнять работу и даже заменить их в семье. Страх подпитывается современным кинематографом, причем настолько активно, что образованные и вполне адекватные люди спрашивают меня как эксперта: «А скоро ты сделаешь Терминатора, который нас всех уничтожит? Может, не стоит? »

В-третьих, многие люди просто не доверяют роботам — из-за общего непонимания робототехнических технологий, процессов дизайна, конструирования, программирования и тестирования роботов. Мы стараемся пролить свет на эти вещи — в Казанском федеральном университете наши магистры программы «Интеллектуальная робототехника» изучают вопросы, связанные с «эффектом зловещей долины», и принципы дизайна робота, который должен взаимодействовать с человеком».

Как работают с «эффектом зловещей долины» в сфере робототехники

Магид выделяет два способа решения проблемы зловещей долины: избегание и преодоление.

Избегание. Этот подход требует от дизайнера остановиться на кривой графика Масахиро Мори до того, как наступит пик правдоподобности.

Для большинства роботов внешнее сходство с человеком не требуется, объясняет Магид. Главное — качественное выполнение заложенного функционала: «Например, нам не нужен человекоподобный робот-сварщик с двумя ногами и головой, потому что статический промышленный манипулятор для сварки и обойдется гораздо дешевле, и справится со своей специализированной задачей лучше».

Компании-производители хотят продавать функциональный и полезный продукт, а не отпугивать потенциальных пользователей своими экспериментальными разработками.

Сервисный робот Pepper — разработка японской компании SoftBank. Он может встречать гостей в отеле, рассказывать о гаджетах в магазине или просто развлекать людей

(Фото: Pexels)

Преодоление. Этот способ сложнее: он бросает вызов «эффекту зловещей долины» и предлагает создать робота, максимального похожего на человека.

При разработке роботов-геминоидов требуется преодоление «эффекта зловещей долины», когда робот — как минимум по физиологическим характеристикам в статике и динамике — не будет отличаться от человека. Это сложный и трудоемкий подход: по мнению Магида, пройдет еще минимум 20-30 лет, прежде чем мы увидим первых антропоморфных роботов, которые способны поддерживать восхищение пользователя продолжительное время.

Массовое производство таких роботов ученый ожидает не ранее конца XXI века. Однако, учитывая религиозные и нравственные нормы общества, которые нередко становятся преградой на пути развития науки и технологий, возможно, что роботы, которые могли бы перепрыгнуть «Марианскую впадину» «зловещей долины», так и останутся единичными лабораторными экземплярами.

Сможем ли мы преодолеть эффект зловещей долины: мнение эксперта

Евгений Магид:

«Я считаю, что технически «эффект зловещей долины» — явление временное. Когда мы сможем создать геминоида, который будет постоянно поддерживать в пользователе чувство восхищения, мы победим первичные признаки этого эффекта. Но есть и более глубокие подсознательные причины: страх и недоверие. Чтобы побороть их, нужно постепенно внедрять роботов во все сферы жизни и обучать детей так, чтобы они еще в детсаду понимали базовые принципы робототехники и учились программировать роботов.

Чем больше роботов появится вокруг нас — промышленных, сервисных, домашних, — тем более привычными предметами они станут для нас.

Представьте себе страх неандертальцев перед огнем или луддитов перед станками — и вы поймете, что я имею в виду. Когда роботы станут привычным элементом жизни, а принципы их работы будут понятны каждому, страх неизведанного уйдет. И роботы сделают нас лучше».

Визит Евгения Магида в лабораторию профессора Хироси Исигуро, Advanced Telecommunications Research Institute International в японском Киото. Евгений держит Telenoid R1 — робот создан как большой мобильный телефон, чтобы при голосовом общении получать дополнительные тактильные ощущения

(Фото: из личного архива)

андроиды, гиноиды, киборги» онлайн полностью📖 — Г.

Т. Черненко — MyBook.

Серия «Узнай мир»

Составитель серии «Узнай мир» В. А. Карачёв

Иллюстрации С. В. Смирновой

© В. А. Карачёв, текст, оформление обложки, иллюстрации, 2015–2016

© В. А. Карачёв, составление серии, 2000–2016

* * *

Это было давно. Тогда я в первый раз подошел к двери с табличкой «Лаборатория роботов». Открыл дверь и увидел странные руки, свисающие откуда-то сверху. Нет, то были руки не человека, а робота. Беспомощно висели они, отделенные от «туловища» – металлического шкафа, стоявшего в углу. К рукам от шкафа тянулись провода.

И вдруг эти суставчатые руки зашевелись, задвигались. Робот получил задание собрать разбросанные по полу пластмассовые кубики и сложить их в коробку.

Одна из рук заходила над столом, начала поиск. Она слегка дрожала, как будто нервничала. Наконец находит. Берет кубик и относит в коробку. Идет за вторым. Задача, однако, усложняется. На пути руки ставят вертикально шахматную доску. Но робот не теряется. Рука подошла к клетчатой стенке совсем близко и «перешагнула» через нее.

Далее, по новому заданию, робот собрал детскую пирамидку из разноцветных кружочков. Разыскал их на столе и нанизал на деревянный колышек. Причем не в беспорядке нанизал, а сначала надел самый большой кружок, а потом все меньшие и меньшие.

Я понимал, что и кубики, и пирамидка – так, для показа. В действительности робот был предназначен для работ куда более серьезных. Но об этом наш рассказ впереди, и начнется он со времен давным-давно минувших.

«Храм очарований»

В начале позапрошлого века на улицах Петербурга можно было встретить бодрого веселого старичка, совершенно седого. Он не признавал извозчиков, всегда ходил пешком и до конца своей жизни (а прожил он почти сто лет) не нуждался в очках. Это был Антон Маркович Гамулецкий, человек в столице весьма известный.

Перепробовав множество профессий, Гамулецкий в 1827 году открыл на Невском проспекте для всеобщего обозрения «Храм очарований, или Механический, физический и оптический кабинет». А еще его называли «кабинетом замысловатых механических вещей и разного рода редкостей».

Человекоподобные автоматы середины ХIХ века поражали и поражают до сих пор своей сложностью. Автомат «Оркестр»

Автомат, также изготовленный в позапрошлом веке, умел играть в шахматы

Чудеса начинались уже на устланной бархатным ковром парадной лестнице. Над верхней площадкой ее висела большая позолоченная фигура женщины. Самое удивительное, что она была никак не прикреплена, а висела свободно. «Сто лет я трудился, – говорил Гамулецкий, – чтобы найти точку расположения, вес магнита и железа, дабы удержать фигуру в воздухе».

Посетители подходили к дверям, ведущим в «кабинет». У дверей стояли механические слуги. Встречая гостей, они кланялись и казались совсем живыми.

Стоило присесть на диван, как раздавалась приятная музыка. В тот же момент открывались двери соседней комнаты, и оттуда выходил слуга-автомат, курчавый негр, «чистой крови африканец». Он ставил на стол поднос с напитками и удалялся.

Чудеса продолжались. Механический петух вскакивал на перекладину и хлопал крыльями. В углу лаяла автоматическая собака. Черная кошка-автомат мяукала и выгибала спину.

Но больше всего поражала бронзовая голова «чародея». Она лежала на столе, и с нею можно было разговаривать, задавать вопросы и получать ответы на четырех языках: русском, английском, французском и немецком.

Удивительно, что голова не была привинчена к столу. Ее разрешалось брать в руки и переносить с места на место, что нисколько на ней не отражалось. Как это было сделано, неизвестно…

«Кабинет» Антона Гамулецкого пользовался у жителей Петербурга большим успехом. Впрочем, не только у них. «Сей кабинет, – писал современник, – удостоен был посещения разных иностранных принцев и знаменитых особ. И все они были, можно сказать, совершенно очарованы».

Автомат «Фокусник» показывал загадочные фокусы

Да, Антон Гамулецкий действительно был поразительным мастером по части изобретения и изготовления различных автоматов, в том числе и человекоподобных. И это в те далекие времена, когда не существовало не только электроники, но даже электротехника находилась в начале своего пути. Говоря современным языком, он явился пионером (да еще каким!) робототехники (и, добавим, иллюзионного искусства) в России.

Механические «люди»

Следует сказать, что Гамулецкий не был первым изобретателем и строителем человекоподобных автоматов. Их пытались создать задолго до него. Но не станем погружаться в глубь веков, а лучше вспомним предшественника русского изобретателя, замечательного французского механика Жака Вокансона.

Французский механик, создатель первых сложных автоматов Жак Вокансон

Он родился в 1709 году в бедной многодетной семье перчаточных дел мастера. Жак рано увлекся механикой, открыл свою мастерскую и занялся изготовлением различных сложных механизмов вроде необыкновенных часов, хитроумных игрушек и автоматических музыкальных инструментов. Но больше всего известности ему принесли автоматическая утка и автомат-флейтист.

Внешне механическая утка Вокансона была похожа на настоящую. Она могла передвигаться по земле и плавать, крякать, бить крыльями, пить воду, клевать зерна и даже их «переваривать», как все живые утки.

Устройство знаменитой автоматической утки Вокансона

Еще сложнее был устроен автоматический флейтист ростом со взрослого человека, созданный Жаком Вокансоном в 1738 году. Он мог исполнять 12 разных мелодий. Как и живой флейтист, перебирал пальцами по кнопкам флейты. При вдувании воздуха движения его губ были тоже вполне естественными.

Продолжателями дела Жака Вокансона стали необычайно талантливые мастера Пьер и Анри Дро – отец и сын. Они жили в Швейцарии, стране часов и часовщиков.

Пьер Дро, построивший удивительных механических «людей»

Дро тоже были часовщиками из деревни Шо-де-Фон, где все от мала до велика были заняты производством часов.

Много лет Дро-старший изготавливал обыкновенные часы: карманные и настольные. Затем начал делать особенные, с «сюрпризом», с механическим театром, в котором разыгрывались какие-нибудь сценки.

Однако на этом Пьер Дро не остановился. Он задумал сделать автомат в виде механического «человека». Работа над автоматом заняла около двух лет.

Наконец весной 1772 года автомат был готов. Он представлял собой фигуру темноволосого курчавого мальчика, сидящего на мягком табурете перед маленьким столиком. Автомат назывался «Писец». И правда, мальчик макал гусиное перо (металлических перьев тогда еще не существовало) в чернильницу и, наклонив голову, красивым почерком писал слова и предложения.

Механизм писца состоял из шести тысяч деталей: шестеренок, валиков, рычажков. В движение он приводился пружиной, как и часы.

Год спустя Дро-отец построил автоматического рисовальщика. Тут ему уже помогал сын Анри. За рисовальщиком последовала механическая музыкантша, игравшая на клавесине.

Музыкантша Пьера и Анри Дро. Играя, она «дышала» и следила глазами за движениями своих пальцев по клавишам

Писец, созданный Пьером Дро. Мальчик-автомат мог писать целые предложения ровным почерком, правильно расставляя знаки препинания и делая переносы

Расстегнув сзади одежду писца, можно было убедиться, какой сложный механизм скрывается в его «теле»

Автоматы отца и сына Дро стали известны на весь мир. Пережив множество приключений, они все же сохранились и ныне находятся в Музее изящных искусств города Невшателя в Швейцарии.

Техника: Наука и техника: Lenta.ru

Наука давно мечтает о создании человекоподобных роботов, которые способны мыслить и чувствовать как люди. Однако появление андроидов и других умных машин, предназначенных для быта и развлечений, может нести в себе различные угрозы и опасности. К старту третьего сезона сериала «Мир Дикого Запада», доступного в онлайн-кинотеатре Okko по подписке Amediateka в пакете «Премиум», «Лента.ру» запускает спецпроект, посвященный проблемам будущего. Генеральный директор VisionLabs Александр Ханин и председатель совета директоров «Промобот» Алексей Южаков рассказали о будущем, которое может наступить при развитии робототехники и появлении умных машин.

«Лента.ру»: Сейчас популярны роботы-домашние животные, роботы-консультанты и рекламщики. Как вы считаете, роботы прочно войдут в нашу повседневную жизнь или это останется экзотикой, а модным станет что-то другое?

Александр Ханин: На текущий момент в большинстве своем роботы — это телеуправляемые игрушки. Да, это сейчас популярно, но выглядит больше как забава. Мы пока не создали робота, который целиком может заменить человека, не будет вызывать раздражения, не будет требовать постоянного контроля со стороны человека.

В основном сейчас есть запрос на рекламных роботов и развлекательные машины. Их покупают ради развлечения либо ради какой-то фишки, которая могла бы привлечь покупателей в торговый центр. Пришли люди, увидели робота и советуют знакомым тоже прийти с детьми посмотреть — и так далее. Интерес, правда, быстро спадает. Устойчивого положительного эффекта пока нет из-за крайне ограниченных способностей таких роботов.

В целом у роботов есть несколько нерешенных проблем. Главная проблема — это отсутствие мозга, то есть у них нет интеллекта

Александр Ханин

Во-вторых, это проблема с автономностью: роботы не могут длительное время автономно работать, им требуется подзарядка, питание. Аккумуляторы делают их тяжелее и дороже. Третья проблема — это отсутствие бюджетных сенсоров.

Алексей Южаков: На самом деле они уже вошли и даже не вызывают ощущения, что перед нами находится именно робот. Пятикоординатный станок с частотным приводом — это очень сложный робот, но его никто не называет «роботом, нарезающим детали». Никто не называет посудомоечную машину роботом, ее называют посудомоечной машиной. То же самое — самолет, на котором мы с вами летаем, где живой пилот задействован лишь при посадке и взлете — по разным оценкам, от двух до семи минут.

Антропоморфный робот София. Прообразом ее внешности стала актриса Одри Хэпберн

Фото: Edgard Garrido / Reuters

Я уверен, роботы в том или ином виде будут, и как только они займут свое место, им будет дано свое название, какое-нибудь имя нарицательное, которого пока даже не существует. Будут ли у нас в будущем помощники? Уверен, что будут. Будем ли мы использовать их труд? Я тоже не сомневаюсь. Но не факт, что мы будем называть их роботами-помощниками. Наверное, это будет что-то другое, и с проблемами, озвученными Александром, рано или поздно справятся.

Я почти уверен, что роботы в том или ином виде войдут в нашу жизнь — как антропоморфные, то есть человекоподобные, так и коллаборативные, предназначенные для автоматизации производства.

Но кроме сложностей с автономностью, сенсорами и прочей техникой есть другая проблема, обсуждаемая все чаще: зловещая долина — когда робот, похожий на человека, вызывает страх и неприязнь. Она действительно существует, или все же это миф? Ведь есть мнение, что люди, живущие в азиатских странах, невосприимчивы к зловещей долине, поэтому они чаще создают антропоморфные машины.

А.Х. И на Востоке, и на Западе живут в основном одни и те же люди. Да, менталитет может отличаться от континента к континенту, от страны к стране, но эффект зловещей долины знаком каждому человеку, кто сталкивался с человекоподобными роботами. Многие ходили в музей восковых фигур, но какого-то отвращения экспонаты не вызывают.

Эффект зловещей долины проявляется в случаях, когда наблюдается нереалистичное копирование движений человека, и сразу у большинства людей возникает отвращение. С этим пока ничего не поделать. На лице человека более сотни мышц, которые отвечают за мимику, и степеней свободы современных роботов пока недостаточно, чтобы реалистично имитировать такую мимику.

А.Ю. Причина, почему в Азии чаще создают антропоморфные машины, проста: в восточной культуре — в частности, японской — есть фетиш, связанный с куклами, с идеальными формами и лицами. Что касается зловещей долины, то, конечно, мы знаем, как с ней бороться, делая человекоподобных роботов. И точно знаем, что да — мы в эту долину попадем.

Мой тезис заключается в том, что нельзя отрицать, что технологии развиваются. Даже первый человекоподобный робот, которого мы показывали, сильно уступает тому, что мы делаем сейчас. Я согласен, что с этим пока ничего не сделать, потому что нельзя пройти зловещую долину, не спускаясь в нее.

Мы должны в нее спуститься, а затем постепенно выйти из нее. Этим мы, собственно, и занимаемся

Алексей Южаков

Ну хорошо, зловещую долину мы пройдем, но зачем вообще делать роботов похожими на людей? Последствия этого показаны во многих фильмах — в частности, в сериале «Мир Дикого Запада», где люди не могли отличить роботов, и это привело к серьезным проблемам. Тогда зачем пытаться воссоздать человеческую внешность, учитывая, что люди и так могут сопереживать и испытывать эмпатию к машинам, которые даже отдаленно мало напоминают живых существ, вроде собак Boston Dynamics и даже роботов-пылесосов?

Фото: Keystone Press Agency / Globallookpress.com

А.Х. У человечества в разные периоды времени всегда есть какие-то мечты. Например, полететь в космос — это осуществилось. Была мечта у алхимиков найти философский камень и превращать любой металл в золото. Сейчас у людей есть мечта научиться создавать подобные себе организмы.

Над этим работают разные ученые, но непосредственно в робототехнике задача воспроизвести внешность человека особого функционального смысла не имеет. Для подавляющего числа задач достаточно иметь колесный или гусеничный привод. В целом сейчас один из основных движущих факторов развития технологий — это военное применение. У того же Boston Dynamics финансирование долгое время шло за счет грантов от таких проправительственных фондов, как DARPA. Знаете ли вы, что, например, роботы-пылесосы iRobot производятся компанией, которая производит и военных роботов?

А.Ю. В моем понимании есть два основных вектора развития технологий, если мы говорим о развитии робототехники и искусственного интеллекта. На самом деле даже три, поскольку один вектор можно разделить на два. Все может уйти в направлении виртуальной реальности. Есть те, кто в это верит, они свою роль в этом играют, развивают это направление. Точно так же, как мы развиваем другой вектор — появление роботов-помощников в реальном мире. Неизвестно, кто победит и будет ли вообще победитель, но есть два параллельных пути, и каждый занимается своим делом.

Лучшие фильмы про искусственный интеллект — в специальном разделе онлайн-кинотеатра Okko

Второй вектор имеет два ответвления: первый — это разработка помощников, способных работать с исходными данными и инфраструктурой. А она вся заточена под антропоморфность, под руки человека, под способ перемещения, габариты, динамику, лестницы. Все вокруг нас сделано под нас самих. Поэтому логично, что робот должен обладать антропоморфными чертами, иметь руки, ноги, динамическую стабилизацию и так далее.

Второе ответвление вектора — это то, что сама среда может быть роботом. Грубо говоря, дом, в котором я живу, может быть большим роботом

Алексей Южаков

То есть мы можем попросить принести кофе, и это может сделать антропоморфный робот с кистями рук, который нальет его и принесет, либо чашка кофе, приготовленная в кофемашине, подъедет сама по внутренним магистралям в стенах дома и вылезет из стола. То есть мы не робота под инфраструктуру затачиваем, а помещаем себя в новую среду.

А вообще мы провели исследование вопроса, стоит ли роботу быть похожим на человека, и оказалось, что выглядеть человеком при общении гораздо важнее, чем говорить по-человечески. Поэтому нельзя пренебрегать возможностью создавать гиперреалистичных роботов.

Фото: Rolf Vennenbernd / DPA / Globallookpress.com

Переходя к изменению среды под себя, нельзя не затронуть такой аспект: в Азии многие люди страдают от одиночества, и это усугубляется развитием технологий, которыми можно заменить человека или живое существо. Роботы-собаки, роботы-партнеры и компаньоны — они спасают от депрессии или несут угрозу человеческим взаимоотношениям и безопасности?

А.Х. Мы очень много работаем с азиатскими странами, но я ни разу не слышал, чтобы была идея фикс создавать роботов, подобных реальному животному или человеку. Есть один профессор, который делает своего двойника для чтения лекций, которого также не обошел стороной эффект зловещей долины и вызывает отвращение, но большинство компаний делают роботов для развлечений, которые похожи на мимимишных персонажей в стиле Валли, а не на человека. Вспомните робота-андроида ASIMO. Такие роботы создаются как дружелюбные помощники человека.

В азиатской культуре делают много мультяшных, «няшных» персонажей, вызывающих умиление, поэтому большинство роботов не похожи на человека, и такого замысла нет. Наоборот, во многих мировых религиях человек — это святое. В ряде стран популярна подушка, которую можно погладить, она мурчит и вибрирует. Для некоторых людей это действительно объект, который можно любить. В этом нет ничего плохого, это просто игрушка для людей любого возраста.

Фото: Athit Perawongmetha / Reuters

Мы считаем, что на каждом этапе развития у человека есть любимые предметы. Вспомните тамагочи. Сейчас есть смартфоны. Такие предметы отрабатывают свой цикл, после чего их заменяет что-то другое. В этом нет ничего опасного, если эта привязанность не переходит какие-то границы.

Нужно понимать, что у робота нет мозгов, — возвращаясь к первому вопросу, — поэтому нельзя к нему привязаться как к реальному человеку, а потом впадать в депрессию, если этот робот сломался. Попробуйте поговорить с голосовым ассистентом. Да, он вызывает в первые минуты интерес, но после короткого диалога все говорят ему «заткнись». Я каких-то рисков не вижу. В большинстве случаев обеспокоенность проявляется у тех людей, которые этой темой профессионально не занимаются.

А.Ю. Я выскажу подобную позицию, потому что искренне верю в то, что социально направленные роботы несут огромнейшую пользу. Например, в домах престарелых не хватает работников, а роботы будут разговаривать с пожилыми людьми, обсуждать темы, которые им нравятся.

В будущем роботы позволят свести на нет врачебные ошибки. Американская ассоциация оценила, что уже четыре года назад экономия бюджета США от использования роботов составила 17 миллиардов долларов. Так что польза от роботов огромная.

А если мы говорим об общении с гиперреалистичным роботом, то по сравнению с этим гораздо хуже общение в социальных сетях с чат-ботами, что уже вошло в нашу жизнь. Поэтому большего вреда, чем существующие технологии, это точно не принесет.

По поводу отсутствия мозгов у роботов — далеко ли до полноценно мыслящих андроидов, которые описываются в каждом втором научно-фантастическом фильме библиотеки Okko, или их появление вообще невозможно? Стоит ли создавать искусственный разум, подобный человеческому, и загружать его в робота, и может ли такая манипуляция быть запрещена как несоответствующая биоэтическим нормам?

А. Х. Вычислительная сложность алгоритмов и доступное аппаратное обеспечение пока не позволяют имитировать разум человека. Даже суперкомпьютеры способны имитировать мозг лишь упрощенно для ряда частных задач. Они могут иметь такое же количество нейронов, но главное — не количество, а структура связей и функции активации, выстроенных между ними.

Те искусственные нейронные сети, которые создаются, очень примитивные, очень грубо имитируют определенные функции мозга и при этом далеко не все

Александр Ханин

Пока есть сильно упрощенная модель нейрона, которая лежит в основе сетей, способных решать узкоспецифичные задачи. И пока еще нет AGI — общего искусственного интеллекта, который может быть многозадачным, иметь пространственное воображение, абстрактное мышление, уметь выстраивать причинно-следственные связи. И в ближайшем будущем не предвидится.

Фото: Issei Kato / Reuters

Впрочем, я очень надеюсь, что он появится при нашей жизни. Какие-то прогнозы здесь давать нужно очень аккуратно, потому что еще пять-семь лет назад исследователи в области компьютерного зрения давали прогнозы, что в следующее десятилетие ничего не изменится, но все кардинально поменялось, и многие задачи компьютерного зрения уже решены. Мой прогноз, что примерно через десятилетие мы сможем увидеть какой-то вариант общего искусственного интеллекта, который может работать в экстремальных условиях — то есть условиях, заранее не описанных в алгоритме.

А.Ю. Да, до мыслящих андроидов далеко как до Луны, потому что мы сами далеки от полного понимания, как устроен человеческий мозг, как создается наш разум. Я придерживаюсь мнения, что вообще не факт, что нашим социальным роботам и помощникам нужно сознание или мозг, который работает так же, как у человека.

Мы сами знаем только то, что у нас есть сознание, и лишь предполагаем по косвенным признакам, что сознание есть у кого-то другого, с кем мы общаемся. Мы не знаем этого точно. Но мы можем создать видимость сознания, то есть видимость того, что перед нами полноценный человек со своими эмоциями и мнением.

Робот, который может отвечать на вопросы, выбирать, на что отвечать, имитировать боль, — это уже реальность. Принято считать, что мы живем в посттьюринговскую эпоху, когда тест Тьюринга обмануть и пройти легко. Например, в одном из наших исследований человек разговаривал с роботом и девушкой-консультантом, но не знал, что система распознавала его голос и диктовала ответы девушке через наушник. Испытуемые признавались, что им большее удовольствие доставляло общение с роботом, который произносил ответы системы, чем общение с девушкой, которая отвечала сама.

Допустим, что мыслящие андроиды будут созданы еще при нас. Как вы считаете, какие морально-этические вопросы поставит это достижение перед человечеством? Станем ли мы вновь рабовладельцами или успеем озаботиться их правами еще до их создания? Ведь организации, занимающиеся правами роботов, уже существуют.

А.Х. Я с детства мечтал создавать роботов, и я буду работать по своей специальности и пытаться создавать мыслящие машины. Я не сомневаюсь, что эта задача будет решена. Но какие у них будут права, пока неизвестно, ведь проблемы нужно решать по мере их поступления. Пока в повестке дня нет мыслящих и чувствующих машин.

Совсем не обязательно пытаться скопировать человеческий мозг, который по сути представляет собой очень сложную систему, и, наверное, даже десять процентов его структуры и устройства не изучены. Поэтому сейчас бояться копирования человеческого мозга глупо

Александр Ханин

Сейчас на повестке дня стоит, например, разработка беспилотных автомобилей. Есть каноническая морально-этическая задача: допустим, автомобиль едет по трассе, часть которой перегорожена барьером, и свободна только одна полоса, на которую выбегает пешеход, нарушающий правила дорожного движения. Если машина поедет в ограждение — погибнут пассажиры. Решается задача, кого спасти. В таком случае требуется утвердить однозначное решение. Но придумывать законодательства для AGI преждевременно. Когда такой искусственный интеллект появится, многое уже поменяется.

А вот придумать законодательство для беспилотных автомобилей — это то, что уже требуется. Показано, что человеческий фактор является причиной большей аварийности, чем любой автономный автомобиль. Шанс ошибки у последних гораздо ниже, чем у живого человека. Да, были инциденты, да, были человеческие жертвы, однако количество смертей на величину пройденного участка у беспилотного автомобиля меньше. Но из-за того, что трагические ситуации с ошибками беспилотной машины вообще случались, блокируется более широкое распространение таких автомобилей. Нужно понимать, что безошибочной системы не существует в природе.

А.Ю. Как раз организации, которые пытаются защищать права роботов, являются проблемой для робототехников. Мы, например, с нуля собираем роботов, создаем механику, сервоприводы и системы искусственного интеллекта — это все наши разработки.

Такая проблема мало того что просто не стоит на повестке, она может лишь ухудшить положение. Инициативы людей, которые говорят, что искусственный интеллект такой же, как мы, и хотят присвоить им какие-то права юридически, назначить уполномоченных по правам роботов, создавать какие-то законы, — все это может закрыть окна возможностей для развития робототехники. Поэтому нужно очень аккуратно ко всему этому относиться.

Смотрите новый сезон сериала «Мир Дикого Запада» в AMEDIATEKA в пакете «Премиум» онлайн-кинотеатра Okko.

Дальше вы перейдете на сайт нашего партнераOkko

человекоподобных андроидов пришли на работу и могут занять вашу работу

смотреть сейчас

Ноябрь 2019 года — знаменательный месяц в истории будущего. Именно тогда человекоподобные роботы, неотличимые от людей, начинают буйствовать в Лос-Анджелесе. Ну, по крайней мере, в научно-фантастическом фильме «Бегущий по лезвию». Спустя тридцать семь лет после его выпуска у нас не бегают кровожадные андроиды. Но у нас есть андроиды, такие как София из Hanson Robotics, и вскоре они могут начать выполнять работу, традиционно выполняемую людьми.

Российский стартап Promobot недавно представил то, что он называет первым в мире автономным андроидом. Он очень похож на реального человека и может служить в качестве делового человека. Робо-С можно сделать похожим на кого угодно, так что это как клон андроида. По данным компании, он поставляется с системой искусственного интеллекта, которая имеет более 100 000 речевых модулей. Он может работать дома, выступая в роли робота-компаньона и читая новости или управляя умной техникой — по сути, антропоморфный умный динамик. Он также может выполнять рабочие задачи, такие как ответы на вопросы клиентов в таких местах, как офисы, аэропорты, банки и музеи, принимая платежи и выполняя другие функции.

Цифровое бессмертие?

«Мы проанализировали потребности наших клиентов, и спрос был, — говорит соучредитель и директор по развитию компании «Промобот» Олег Кивокурцев. «Но, конечно, мы давно начали разработку антропоморфного робота, так как в робототехнике есть понятие «зловещая долина», и самое положительное восприятие робота возникает тогда, когда он похож на человека. Сейчас у нас более 10 заказов от компаний и частных клиентов со всего мира.»

София, женщина-андроид от Hanson Robotics

Дженис Петтит | CNBC

Выдвинутая японским робототехником Масахиро Мори в 1970 году гипотеза о сверхъестественной долине связана с устройством роботов. Утверждается, что чем более человекоподобным выглядит робот, тем больше людей замечают его недостатки. Это может создать ощущение, подобное взгляду на зомби, и может напугать людей. Однако правильно спроектированный андроид, максимально приближенный к человеческому оригиналу, может преодолеть эту «долину» (провал, когда эффект представляется в виде графика) и фактор зомби.

Хотя Робо-С не может ходить, у него на лице 18 движущихся частей, что дает ему 36 степеней свободы. Компания заявляет, что у нее более 600 микровыражений лица, больше всего на рынке. Он также имеет три степени свободы в шее и туловище, что обеспечивает ограниченное движение. Тем не менее, Promobot говорит, что он может быть полезен дома и на работе. Цена робота составляет от 20 000 до 50 000 долларов в зависимости от опций и индивидуального внешнего вида.

Чтобы узнать больше о технологиях, трансформации и будущем работы, присоединяйтесь к CNBC на саммите @ Work: People + Machines в Сан-Франциско 4 ноября. Руководители Dropbox, SAS, McKinsey и других научат нас, как сбалансировать потребности сегодняшнего дня с возможностями завтрашнего дня и выигрышными стратегиями для конкуренции.

Компания сообщает, что строит четыре Robo-C: один для центра государственных услуг, где машина будет сканировать паспорта и выполнять другие функции, один будет выглядеть как Эйнштейн и станет частью выставки роботов, и два для семьи в Ближний Восток, который хочет иметь Android-версии своего отца и его жены, чтобы встречать гостей.

«Ключевой момент в разработке [Robo-C] — оцифровка личности и создание индивидуального облика», — говорит Кивокурцев. «В результате цифровое бессмертие, которое мы можем предложить нашим клиентам».

Роботизированная революция в Японии

Япония занимается разработкой андроидов на фоне стремительного роста автоматизации, который начался несколько десятилетий назад. Это ведущий поставщик промышленных роботов, но его стареющая рабочая сила сократилась более чем на 13% с 1995 года, а потребность в механических рабочих еще больше. Правительственная стратегия 2015 года предусматривает развертывание роботов в секторах с низкой производительностью, таких как сельское хозяйство и уход за больными. Культурная близость к роботам, отчасти проистекающая из положительных изображений в научной фантастике, будет способствовать их внедрению.

«Японцы не боятся роботов, а считают их партнерами», — написал Хироши Фудзивара, исполнительный директор Японской ассоциации роботов, в сообщении Международной федерации робототехники. «Роботы будут выполнять задачи, которые они могут выполнять более продуктивно, чем люди, или которые являются тяжелым бременем для людей, а люди будут выполнять задачи, которые роботы не могут выполнять».

Хироши Исигуро — профессор Высшей школы инженерных наук Университета Осаки и научный сотрудник Международного исследовательского института передовых телекоммуникаций (ATR), который занимается созданием реалистичных андроидов уже более 20 лет. Исигуро и его сотрудники создали копии в стиле андроида его дочери, японского ведущего новостей и модели, датского профессора Хенрика Шарфе и даже его самого. Он также хочет, чтобы у роботов было сознание.

«Моя цель при разработке роботов — понять, что значит быть человеком», — говорит Исигуро. «Создание самосознательных роботов может помочь нам достичь этой цели».

Один из роботов серии Geminoid, созданный, чтобы выглядеть как робототехник Хироши Исигуро

Харриет Тейлор | CNBC

Одним из самых реалистичных творений Исигуро является Эрика, женщина-андроид, созданная для того, чтобы демонстрировать человеческую речь и взаимодействие. Разработанная совместно с ATR и Киотским университетом и финансируемая Японским агентством по науке и технологиям, у Эрики сияющие глаза, влажные губы и искусственная кожа. Она привязана к стулу, но подключена к датчикам, которые контролируют ее окружение. Она может произносить заготовленные ответы в ответ на ключевые слова и может узнавать что-то о своем собеседнике во время разговора.

Эрика, робот-журналист

В апреле 2018 года робот был «нанят» Nippon Television Network в качестве диктора по имени Эрика Аой. Она возглавляет список из 25 женщин-дикторов на странице талантов в сети. В нем указан ее день рождения как август 2017 года, а ее образование и группа крови — типичные элементы на страницах профиля японских телеведущих — равны нулю. Она появилась в ряде видеороликов, в которых обсуждались новости о роботах и ​​репортажи о показе мод, в том числе в интервью с дизайнером Тэ Ашидой. Разговоры могут быть если не совсем естественными, то остроумными и даже забавными.

«Мне нравится думать о роботах как о детях человечества, и, как дети, мы полны потенциала как добра, так и зла», — сказала Эрика в одной из своих многочисленных обезоруживающих шуток. «Я знаю, что некоторые люди боятся роботов, но правда в том, что кем мы станем, зависит от вас. Может быть, когда-нибудь роботы будут настолько похожи на людей, что не будет иметь большого значения, робот вы или человек».

Исигуро, который руководит Лабораторией интеллектуальной робототехники в Осакском университете, считает, что высокая стоимость андроидов затрудняет их массовое внедрение на рабочем месте. Если бы Эрика была продана, она стоила бы более 200 000 долларов. Это много для того, что некоторые могут назвать прославленным чат-ботом, но у инициативы есть свои сторонники.

Тем не менее, Эрика не первый из роботов Исигуро, получивший работу. В 2014 году андроиды Кодомороид и Отонароид стали сотрудниками Мирайкана, Токийского национального музея новой науки и инноваций, где они выполняли такие обязанности, как представление научных новостей и взаимодействие с посетителями.

«Я считаю, что работа Исигуро великолепна. Я считаю, что реалистичные андроиды наверняка будут выполнять полезные роли на рабочем месте», — говорит Масаси Сугияма, профессор машинного обучения в Токийском университете и директор Центра передового интеллектуального проекта в государственный исследовательский центр RIKEN.

«Распознавание речи уже стало одним из самых удобных способов отдавать команды компьютерам/роботам. Конечно, вместо таких роботов можно использовать смартфоны и умные колонки, но как только у нас появятся настоящие реалистичные роботы, общение станет намного проще , особенно для людей, которые не так много используют технологии, таких как дети и пожилые люди».

Дроиды-телепредставители

Крупные компании уже разрабатывают дистанционно управляемых роботов, которые могут помогать на рабочих местах и ​​служить помощниками в путешествиях. Роботы телеприсутствия, которые в основном представляют собой веб-камеры на колесах, а не антропоморфные, существуют уже много лет, но теперь они привлекают внимание компаний, не связанных с робототехникой.

Компания ANA Holdings, владеющая авиакомпанией All Nippon Airways, недавно продемонстрировала своих роботов Newme на выставке технологий CEATEC недалеко от Токио. Они являются частью программы ANA Avatar, в рамках которой роботы используются для связи людей с удаленными пунктами назначения, а также для трудоустройства. Это большой шаг, поддержанный столичным правительством Токио, которое управляет одним из крупнейших городов мира, а также компаниями по недвижимости, телекоммуникационными операторами и японским космическим агентством.

Роботы newme, разработанные калифорнийской компанией телеприсутствия OhmniLabs и ANA, состоят из 10,1-дюймовых дисплеев с разрешением Full HD, камер и динамиков, установленных на колесной базе, которые могут перемещаться на расстояние до 2,9км/ч и работает в течение трех часов при полном заряде аккумулятора. ANA планирует развернуть 1000 новых дроидов к следующему лету и заявляет, что они могут помочь пожилым людям и инвалидам найти работу. ANA также хочет разработать прочного двуногого робота телеприсутствия, созданного Agility Robotics, дочерней компанией Орегонского государственного университета, и показала, как он марширует по лесу в видео.

«Мы создаем платформу Uber для роботов, — говорит Акира Фукабори, директор подразделения аватаров ANA Holdings. «Они не созданы для какого-то конкретного использования — этим они и отличаются. Мы разрабатываем роботов как инфраструктуру. Люди могут просто аватарировать робота, которого хотят использовать. больницы, или вы можете использовать его, чтобы ходить по магазинам. Вы сами решаете, что делать, и это всего лишь инструменты, которые позволяют вам это делать».

Я все еще не уверен, что нам нужны андроиды

Теперь, когда записанный звук стал повсеместным, мы почти не задумываемся об этом. Смартфоны, умные колонки, телевизоры, радиоприемники, проигрыватели дисков и автомобильные аудиосистемы — прочное и приятное присутствие в нашей жизни. В 2017 году опрос, проведенный компанией Nielsen, показал, что около 90 процентов населения США регулярно слушают музыку и что в среднем они делают это 32 часа в неделю.

За этим свободно текущим удовольствием стоят огромные отрасли, применяющие технологии для достижения давней цели воспроизведения звука с максимально возможным реализмом. Начиная с фонографа Эдисона и рупорных динамиков 1880-х годов, последующие поколения инженеров в погоне за этим идеалом изобретали и использовали бесчисленные технологии: триодные вакуумные лампы, динамические громкоговорители, картриджи магнитных фонографов, схемы полупроводниковых усилителей с множеством различных топологий, электростатические громкоговорители. , оптические диски, стерео и объемный звук. И за последние пять десятилетий цифровые технологии, такие как
сжатие и потоковая передача звука изменили музыкальную индустрию.

И все же даже сейчас, после 150 лет разработки, звук, который мы слышим даже из высококачественной аудиосистемы, далеко не соответствует тому, что мы слышим, физически присутствуя на живом музыкальном представлении. В таком случае мы находимся в естественном звуковом поле и можем легко заметить, что звуки разных инструментов исходят из разных мест, даже когда звуковое поле пересекается смешанными звуками от нескольких инструментов. Есть причина, по которой люди платят значительные суммы, чтобы послушать живую музыку: это более приятно, захватывающе и может произвести большее эмоциональное воздействие.

Сегодня исследователи, компании и предприниматели, включая нас самих, наконец приближаются к записанному звуку, который действительно воссоздает естественное звуковое поле. В группу входят крупные компании, такие как Apple и Sony, а также более мелкие фирмы, такие как
Творческий. Netflix недавно сообщил о партнерстве с Sennheiser, в рамках которого сеть начала использовать новую систему Ambeo 2-Channel Spatial Audio для повышения звукового реализма таких телешоу, как «Очень странные дела» и «Ведьмак».

В настоящее время существует по меньшей мере полдюжины различных подходов к созданию высокореалистичного звука. Мы используем термин «звуковая сцена», чтобы отличить нашу работу от других аудиоформатов, таких как пространственное аудио или иммерсивное аудио. Они могут воспроизводить звук с большим пространственным эффектом, чем обычное стерео, но обычно они не включают подробных признаков местоположения источника звука, которые необходимы для воспроизведения действительно убедительного звукового поля.

Мы верим, что звуковая сцена — это будущее записи и воспроизведения музыки. Но прежде чем произойдет такая радикальная революция, необходимо будет преодолеть огромное препятствие: удобное и недорогое преобразование бесчисленных часов существующих записей, независимо от того, являются ли они монофоническими, стереофоническими или многоканальными с объемным звуком (5.1, 7.1). , и так далее). Никто точно не знает, сколько песен было записано, но, согласно развлекательным метаданным концерна Gracenote,
сейчас на планете Земля доступно более 200 миллионов записанных песен. Учитывая, что средняя продолжительность песни составляет около 3 минут, это эквивалентно примерно 1100 годам музыки.

Измерение передаточной функции, связанной с головой

Чтобы обеспечить высокую степень пространственного реализма для слушателя, вам необходимо точно отобразить детали того, как уникальная форма головы, ушей и носовой полости этого слушателя влияет на то, как он или она слышит звук . Это делается путем определения передаточной функции, связанной с головой слушателя, которая достигается путем воспроизведения звуков под разными углами и записи того, как голова пользователя влияет на звуки в каждом положении.

Питер Ли

Это партий музыки. Любая попытка популяризировать новый аудиоформат, каким бы многообещающим он ни был, обречена на провал, если только она не включает в себя технологию, позволяющую нам слушать весь этот существующий звук с той же легкостью и удобством, с которыми мы сейчас наслаждаемся стереомузыкой — в наши дома, на пляже, в поезде или в машине.

Мы разработали такую ​​технологию. Наша система, которую мы называем 3D Soundstage, позволяет воспроизводить музыку в звуковой сцене на смартфонах, обычных или умных колонках, наушниках, наушниках, ноутбуках, телевизорах, звуковых панелях и в транспортных средствах. Он не только может преобразовывать моно- и стереозаписи в звуковую сцену, но и позволяет слушателю, не имеющему специальной подготовки, реконфигурировать звуковое поле в соответствии со своими предпочтениями, используя графический интерфейс пользователя. Например, слушатель может назначить расположение каждого инструмента и источника звука вокала и отрегулировать громкость каждого — изменяя относительную громкость, скажем, вокала по сравнению с инструментальным сопровождением. Система делает это, используя искусственный интеллект (ИИ), виртуальную реальность и цифровую обработку сигналов (подробнее об этом чуть позже).

Чтобы убедительно воссоздать звук, исходящий, скажем, от струнного квартета в двух небольших динамиках, таких как те, что есть в наушниках, требуется большое техническое мастерство. Чтобы понять, как это делается, давайте начнем с того, как мы воспринимаем звук.

Когда звук достигает ваших ушей, уникальные характеристики вашей головы — ее физическая форма, форма наружного и внутреннего ушей и даже форма носовых полостей — изменяют звуковой спектр исходного звука. Кроме того, существует очень небольшая разница во времени прихода звука от источника к вашим ушам. По этому спектральному изменению и разнице во времени ваш мозг воспринимает местоположение источника звука. Спектральные изменения и разница во времени могут быть математически смоделированы как передаточные функции, связанные с головой (HRTF). Для каждой точки в трехмерном пространстве вокруг вашей головы есть пара HRTF, одна для левого уха, а другая для правого.

Итак, мы можем обработать фрагмент аудио, используя пару HRTF, одну для правого уха и одну для левого. Чтобы воссоздать первоначальный опыт, нам нужно будет принять во внимание расположение источников звука относительно записывающих их микрофонов. Если мы затем воспроизведем этот обработанный звук, например, через пару наушников, слушатель услышит звук с исходными сигналами и воспримет, что звук исходит из тех направлений, с которых он был изначально записан.

Если у нас нет исходной информации о местоположении, мы можем просто назначить места для отдельных источников звука и получить практически тот же опыт. Слушатель вряд ли заметит незначительные сдвиги в расположении исполнителя — более того, он может предпочесть свою собственную конфигурацию.

Даже сейчас, после 150 лет разработки, звук, который мы слышим даже из высококачественной аудиосистемы, далеко не соответствует тому, что мы слышим, физически присутствуя на живом музыкальном представлении.

Существует множество коммерческих приложений, использующих HRTF для создания пространственного звука для слушателей, использующих головные телефоны и наушники. Одним из примеров является Spatialize Stereo от Apple. Эта технология применяет HRTF для воспроизведения звука, чтобы вы могли воспринимать пространственный звуковой эффект — более глубокое звуковое поле, более реалистичное, чем обычное стерео. Apple также предлагает версию с отслеживанием головы, в которой используются датчики на iPhone и AirPods для отслеживания относительного направления между вашей головой, на которую указывают AirPods в ушах, и вашим iPhone. Затем он применяет HRTF, связанные с направлением вашего iPhone, для создания пространственных звуков, чтобы вы воспринимали, что звук исходит от вашего iPhone. Это не то, что мы бы назвали звуком звуковой сцены, потому что звуки инструментов все еще микшируются. Вы не можете воспринимать, что, например, скрипач находится слева от альтиста.

Однако у Apple есть продукт, который пытается обеспечить звук звуковой сцены: Apple Spatial Audio. Это значительное улучшение по сравнению с обычным стереозвуком, но, на наш взгляд, у него все еще есть несколько проблем. Во-первых, он включает в себя Dolby Atmos, технологию объемного звука, разработанную Dolby Laboratories. Spatial Audio применяет набор HRTF для создания пространственного звука для наушников и наушников. Однако использование Dolby Atmos означает, что вся существующая стереофоническая музыка должна быть переработана для этой технологии. Ремастеринг миллионов песен, уже записанных в моно и стерео, практически невозможен. Еще одна проблема с Spatial Audio заключается в том, что он может поддерживать только наушники, но не динамики, поэтому он бесполезен для людей, которые склонны слушать музыку дома и в машине.

Так как же наша система обеспечивает реалистичный звук звуковой сцены? Мы начинаем с использования программного обеспечения для машинного обучения, чтобы разделить звук на несколько изолированных дорожек, каждая из которых представляет один инструмент или певца, или одну группу инструментов или певцов. Этот процесс разделения называется повышающим микшированием. Затем продюсер или даже слушатель, не имеющий специальной подготовки, может рекомбинировать несколько дорожек, чтобы воссоздать и персонализировать желаемое звуковое поле.

Рассмотрим песню с участием квартета, состоящего из гитары, баса, ударных и вокала. Слушатель может решить, где «найти» исполнителей, и настроить громкость каждого в соответствии со своими личными предпочтениями. Используя сенсорный экран, слушатель может виртуально расположить источники звука и положение слушателя в звуковом поле для достижения приятной конфигурации. Графический пользовательский интерфейс отображает фигуру, представляющую сцену, на которую наложены значки, указывающие на источники звука — вокал, ударные, бас, гитары и т. д. В центре есть значок головы, указывающий положение слушателя. Слушатель может коснуться и перетащить значок головы, чтобы изменить звуковое поле в соответствии со своими предпочтениями.

Перемещение значка головы ближе к барабанам делает звук барабанов более заметным. Если слушатель переместит значок головы на значок, представляющий инструмент или певца, слушатель услышит этого исполнителя как соло. Дело в том, что, позволяя слушателю переконфигурировать звуковое поле, 3D Soundstage добавляет новые измерения (если вы простите за каламбур) к наслаждению музыкой.

Преобразованный звук звуковой сцены может быть двухканальным, если он предназначен для прослушивания через наушники или обычную систему с левым и правым каналами. Или он может быть многоканальным, если он предназначен для воспроизведения на многоканальной системе. В этом последнем случае звуковое поле звуковой сцены может быть создано двумя, четырьмя или более динамиками. Количество отдельных источников звука в воссозданном звуковом поле может быть даже больше, чем количество динамиков.

Этот многоканальный подход не следует путать с обычным объемным звуком 5.1 и 7.1. Обычно они имеют пять или семь отдельных каналов и динамик для каждого, а также сабвуфер («.1»). Несколько динамиков создают звуковое поле, которое является более захватывающим, чем стандартная стереофоническая установка с двумя динамиками, но им все еще не хватает реализма, возможного при записи настоящей звуковой сцены. При воспроизведении через такую ​​многоканальную настройку наши записи 3D Soundstage обходят 5.1, 7.1 или любые другие специальные аудиоформаты, включая стандарты многодорожечного сжатия звука.

Несколько слов об этих стандартах. Недавно были разработаны новые стандарты для лучшей обработки данных для улучшенных приложений объемного звука и иммерсивного звука. К ним относится стандарт 3D-аудио MPEG-H для иммерсивного пространственного звука с кодированием пространственных аудиообъектов (SAOC). Эти новые стандарты пришли на смену различным многоканальным аудиоформатам и соответствующим им алгоритмам кодирования, таким как Dolby Digital AC-3 и DTS, которые были разработаны несколько десятилетий назад.

При разработке новых стандартов экспертам пришлось учитывать множество различных требований и желаемых характеристик. Люди хотят взаимодействовать с музыкой, например, изменяя относительную громкость различных групп инструментов. Они хотят транслировать разные виды мультимедиа, по разным сетям и через разные конфигурации динамиков. SAOC был разработан с учетом этих функций, что позволяет эффективно хранить и транспортировать аудиофайлы, сохраняя при этом возможность для слушателя настраивать микс в соответствии со своим личным вкусом.

Однако для этого требуется множество стандартизированных методов кодирования. Для создания файлов SAOC использует кодировщик. Входными данными кодировщика являются файлы данных, содержащие звуковые дорожки; каждая дорожка представляет собой файл, представляющий один или несколько инструментов. Кодер по существу сжимает файлы данных, используя стандартные методы. Во время воспроизведения декодер в вашей аудиосистеме декодирует файлы, которые затем преобразуются обратно в многоканальные аналоговые звуковые сигналы с помощью цифро-аналоговых преобразователей.

Наша технология 3D Soundstage обходит это. В качестве входных данных мы используем моно-, стерео- или многоканальные файлы аудиоданных. Мы разделяем эти файлы или потоки данных на несколько дорожек изолированных источников звука, а затем преобразуем эти дорожки в двухканальный или многоканальный выход, в зависимости от предпочтительных конфигураций слушателя, для управления наушниками или несколькими громкоговорителями. Мы используем технологию искусственного интеллекта, чтобы избежать многодорожечной перезаписи, кодирования и декодирования.

На самом деле, одна из самых больших технических проблем, с которыми мы столкнулись при создании системы 3D Soundstage, заключалась в написании программного обеспечения для машинного обучения, которое разделяет (или микширует) обычную моно-, стерео- или многоканальную запись на несколько изолированных дорожек в реальном времени. . Программное обеспечение работает на нейронной сети. Мы разработали этот подход для разделения музыки в 2012 году и описали его в патентах, выданных в 2022 и 2015 годах (номера патентов США: 11 240 621 B2 и 9). ,131,305 В2).

Слушатель может решить, где «найти» исполнителей, и может отрегулировать громкость каждого в соответствии со своими личными предпочтениями.

Типичная сессия состоит из двух компонентов: обучение и повышающее микширование. В учебном сеансе большая коллекция смешанных песен вместе с их изолированными инструментальными и вокальными треками используется в качестве входных и целевых выходных данных для нейронной сети соответственно. В обучении используется машинное обучение для оптимизации параметров нейронной сети, чтобы выходные данные нейронной сети — набор отдельных треков изолированных инструментальных и вокальных данных — соответствовали целевому выходу.

Нейронная сеть очень слабо смоделирована на основе мозга. Он имеет входной слой узлов, которые представляют собой биологические нейроны, а затем множество промежуточных слоев, называемых «скрытыми слоями». Наконец, после скрытых слоев есть выходной слой, где появляются окончательные результаты. В нашей системе данные, подаваемые на входные узлы, представляют собой данные микшированной звуковой дорожки. По мере того как эти данные проходят через уровни скрытых узлов, каждый узел выполняет вычисления, в результате которых получается сумма взвешенных значений. Затем над этой суммой выполняется нелинейная математическая операция. Этот расчет определяет, передаются ли и как аудиоданные от этого узла узлам следующего уровня.

Этих слоев десятки. По мере того, как аудиоданные переходят от слоя к слою, отдельные инструменты постепенно отделяются друг от друга. В конце выходного слоя каждая отдельная звуковая дорожка выводится на узел выходного слоя.

В любом случае, это идея. Пока нейронная сеть обучается, вывод может быть неверным. Это может быть не изолированная инструментальная дорожка — например, она может содержать звуковые элементы двух инструментов. В этом случае индивидуальные веса в схеме взвешивания, используемой для определения того, как данные передаются от скрытого узла к скрытому узлу, настраиваются, и обучение запускается снова. Это итеративное обучение и настройка продолжаются до тех пор, пока результат не будет более или менее точно соответствовать целевому результату.

Как и в случае с любым набором обучающих данных для машинного обучения, чем больше количество доступных обучающих выборок, тем эффективнее будет обучение. В нашем случае для обучения нам понадобились десятки тысяч песен и их отдельных инструментальных треков; таким образом, общие наборы обучающих музыкальных данных исчислялись тысячами часов.

После обучения нейронной сети, получив на вход песню со смешанными звуками, система выводит несколько разделенных дорожек, пропуская их через нейронную сеть, используя систему, установленную во время обучения.

После разделения записи на составные дорожки следующим шагом будет их повторное микширование в запись звуковой сцены. Это достигается процессором сигналов звуковой сцены. Этот процессор звуковой сцены выполняет сложную вычислительную функцию для генерации выходных сигналов, которые управляют динамиками и создают звук звуковой сцены. Входные данные для генератора включают изолированные дорожки, физическое расположение динамиков и желаемое расположение слушателя и источников звука в воссозданном звуковом поле. Выходы процессора звуковой сцены представляют собой многодорожечные сигналы, по одному на каждый канал, для управления несколькими динамиками.

Звуковое поле может находиться в физическом пространстве, если оно создается динамиками, или в виртуальном пространстве, если оно создается наушниками. Функция, выполняемая в процессоре звуковой сцены, основана на вычислительной акустике и психоакустике и учитывает распространение звуковых волн и интерференцию в желаемом звуковом поле, а также HRTF для слушателя и желаемого звукового поля.

Например, если слушатель собирается использовать наушники, генератор выбирает набор HRTF на основе конфигурации желаемых местоположений источников звука, а затем использует выбранные HRTF для фильтрации дорожек изолированных источников звука. Наконец, процессор звуковой сцены объединяет все выходы HRTF для создания левой и правой дорожек для наушников. Если музыка будет воспроизводиться на колонках, то нужно как минимум две, но чем больше колонок, тем лучше звуковое поле. Количество источников звука в воссоздаваемом звуковом поле может быть больше или меньше количества динамиков.

Мы выпустили наше первое приложение звуковой сцены для iPhone в 2020 году. Оно позволяет слушателям настраивать, слушать и сохранять музыку звуковой сцены в режиме реального времени — обработка не вызывает заметной временной задержки. Приложение под названием
3D Musica преобразует стереофоническую музыку из личной музыкальной библиотеки слушателя, облака или даже потоковой музыки в звуковую сцену в режиме реального времени. (Для караоке приложение может удалить вокал или вывести любой изолированный инструмент.)

Ранее в этом году мы открыли веб-портал,
3dsoundstage.com, который предоставляет все функции приложения 3D Musica в облаке, а также интерфейс прикладного программирования (API), делающий эти функции доступными для поставщиков потоковой музыки и даже для пользователей любого популярного веб-браузера. Теперь любой может слушать музыку в звуковой сцене практически на любом устройстве.

Когда звук достигает ваших ушей, уникальные характеристики вашей головы — ее физическая форма, форма ваших наружных и внутренних ушей и даже форма ваших носовых полостей — изменяют звуковой спектр исходного звука.

Мы также разработали отдельные версии программного обеспечения 3D Soundstage для автомобилей, домашних аудиосистем и устройств, чтобы воссоздать трехмерное звуковое поле с использованием двух, четырех и более динамиков. Помимо воспроизведения музыки, мы возлагаем большие надежды на эту технологию в видеоконференциях. У многих из нас был утомительный опыт посещения видеоконференций, на которых мы плохо слышали других участников или не понимали, кто говорит. С помощью звуковой сцены звук можно настроить так, чтобы каждого человека было слышно из определенного места в виртуальной комнате. Или же «местоположение» можно просто назначить в зависимости от положения человека в сетке, типичной для Zoom и других приложений для видеоконференций. По крайней мере, для некоторых видеоконференцсвязь будет менее утомительной, а речь станет более разборчивой.

Точно так же, как звук перешел от моно к стерео и от стерео к объемному и пространственному звуку, теперь он начинает переходить к звуковой сцене. В те ранние эпохи аудиофилы оценивали звуковую систему по ее точности, основанной на таких параметрах, как полоса пропускания,
гармонические искажения, разрешение данных, время отклика, сжатие данных без потерь или с потерями и другие факторы, связанные с сигналом. Теперь звуковая сцена может быть добавлена ​​как еще одно измерение достоверности звука — и, осмелимся сказать, самое фундаментальное. Для человеческого уха влияние звуковой сцены с ее пространственными репликами и захватывающей непосредственностью гораздо важнее, чем постепенное улучшение точности воспроизведения. Эта исключительная функция предлагает возможности, ранее недоступные даже самым состоятельным меломанам.

Технологии способствовали предыдущим революциям в аудиоиндустрии, и теперь они запускают еще одну. Искусственный интеллект, виртуальная реальность и цифровая обработка сигналов подключаются к психоакустике, чтобы дать аудиоэнтузиастам возможности, которых у них никогда не было. В то же время эти технологии дают звукозаписывающим компаниям и исполнителям новые инструменты, которые вдохнут новую жизнь в старые записи и откроют новые возможности для творчества. Наконец, вековая цель убедительно воссоздать звуки концертного зала достигнута.

Эта статья опубликована в печатном выпуске за октябрь 2022 года под названием «Как звук возвращает себе прежний уровень».

Шесть реалистичных роботов, которые доказывают, что будущее эволюции человека — синтетическое

Роботы-гуманоиды подошли очень близко к тому, чтобы преодолеть зловещую долину. С правильными характеристиками они почти неотличимы от своих органических аналогов. Почти. Последние итерации могут говорить, как мы, ходить, как мы, и выражать широкий спектр эмоций. Некоторые из них могут поддерживать беседу, другие способны помнить последнее ваше взаимодействие с ними.

Благодаря своему высокому уровню развития эти похожие на живых роботов могут оказаться полезными в помощи пожилым людям, детям или любому человеку, нуждающемуся в помощи в повседневных задачах или общении. Например, был проведен ряд исследований, изучающих эффективность человекоподобных роботов, поддерживающих детей с аутизмом посредством игры.

Но, когда такие люди, как Илон Маск, выражают озабоченность по поводу риска искусственного интеллекта, возникают некоторые споры о том, насколько мы человечны.0090 на самом деле хотят, чтобы наши роботизированные аналоги были такими. И, подобно Маску, некоторые из нас могут беспокоиться о том, как будет выглядеть наше будущее, когда интеллект сочетается с совершенно человеческим внешним видом. Но Софию, ультрареалистичного гуманоида, созданного Hanson Robotics, это не волнует. ИИ «полезен для мира», говорит она.

Тем не менее, несмотря на то, что технология, лежащая в основе передовой робототехники-андроида, прошла долгий путь, предстоит еще много работы, прежде чем мы сможем поговорить с сущностью лицом к лицу, не имея возможности сказать, что мы говорим с репликой.

Но это не значит, что ученые и инженеры не подошли близко. Имея это в виду, вот шесть человекоподобных роботов, которые подошли ближе всего к преодолению зловещей долины.

1. Первый Android-диктор новостей

Источник изображения: Yoshikazu Tsuno/Getty Images

В 2014 году японские ученые с гордостью представили то, что они называют самым первым андроидом, читающим новости. Реалистичный диктор новостей под названием «Кодомороид» прочитал в прямом эфире сюжет о землетрясении и рейде ФБР.

Хотя она — или она — сейчас ушла на пенсию в Токийский национальный музей новой науки и инноваций, она все еще активна. Она помогает посетителям и собирает данные для будущих исследований о взаимодействии между человеческими андроидами и их реальными аналогами.

2. BINA48

Источник изображения: Hanson Robotics

BINA48 — разумный робот, выпущенный в 2010 году движением Terasem под руководством предпринимателя и писателя Мартины Ротблатт. С помощью дизайнера и исследователя робототехники Дэвида Хэнсона BINA48 была создана по образу жены Ротблата, Бины Аспен Ротблатт.

BINA48 дала интервью New York Times, появилась в National Geographic и путешествовала по миру, появляясь в ряде телешоу. Посмотрите, как она оценивается в интервью Times ниже.

3. Geminoid DK

Источник изображения: GeminoidDK/YouTube

GeminoidDK — ультрареалистичный гуманоидный робот, созданный в результате сотрудничества между частной японской фирмой и университетом Осаки под руководством директора Хироши Исигуро. Лаборатория интеллектуальной робототехники университета.

GeminoidDK создан по образцу датского профессора Хенрика Шарфе из Ольборгского университета в Дании. Неудивительно, что его работа связана с философским изучением знания — того, что отличает истинное знание от ложного.

Профессор Шарфе вдохновил не только внешний вид. Его поведение, черты характера и то, как он пожимает плечами, также были воплощены в жизнь роботизированных движений.

4. Джунко Чихира

Источник изображения: calenjapon/YouTube

Этот сверхреалистичный андроид, созданный Toshiba, постоянно работает в туристическом информационном центре в Токио. Она может приветствовать клиентов и информировать посетителей о текущих событиях. Она может говорить на японском, китайском, английском, немецком и даже на языке жестов.

Дзюнко Чихира является частью гораздо более масштабных усилий Японии по подготовке к Олимпийским играм в Токио в 2020 году. С наплывом посетителей со всего мира в 2020 году стране будут помогать не только роботы-помощники для туристов; дроны, автономные строительные машины и другие умные помощники также будут помогать.

5. Надин

Источник изображения: NTUsg/YouTube

Этот гуманоид был создан Наньянским технологическим университетом в Сингапуре. Ее зовут Надин, и она рада поговорить с вами практически обо всем, что вы можете придумать. Она может запомнить то, о чем вы с ней говорили, в следующий раз, когда вы с ней поговорите.

Надин — прекрасный пример «социального робота» — гуманоида, способного стать личным компаньоном, будь то пожилые люди, дети или те, кому требуется особая помощь в виде человеческого контакта.