Тест тьюринга пройти: Пройти тест Тьюринга не так-то просто

Пройти тест Тьюринга не так-то просто

Сергей Бобровский

Тест Тьюринга известен каждому человеку, интересующемуся искусственным интеллектом. Его сформулировал в 1938 г. Алан Тьюринг в статье “Может ли машина мыслить?”. Тест заключается в следующем. Экспериментатор общается с собеседником, не видя его (например, по компьютерной сети), набирая фразы на клавиатуре и получая текстовый ответ на мониторе. Затем он пытается определить, с кем вел разговор. Если экспериментатор принимает компьютерную программу за человека, значит, она прошла тест Тьюринга и может считаться интеллектуальной.

Золотую медаль получит все же человек

Наиболее известной программой, еще в 60-х годах показавшей реальную возможность прохождения этого теста, стала легендарная ELIZA. Она была создана в 1966 г. учеными Виноградом, Вейценбаумом и Колби. ELIZA находила в фразе ключевые слова (например, “мать”) и выдавала шаблонную просьбу, механически на эти слова реагируя (“Расскажите побольше о вашей матери”). В дальнейшем Тодди Виноград на основе ELIZA создал более совершенный вариант “Психотерапевт”. Появление ELIZA вошло в историю искусственного интеллекта наряду с такими событиями, как выпуск первого промышленного робота в 1962 г. или начало финансирования Пентагоном разработок в области распознавания образов и речи в 1975-1976 гг.

В 1991 г. впервые состоялся частный, но весьма солидный турнир по прохождению теста Тьюринга, на который были приглашены авторы подходящих компьютерных программ (называемых ботами). Этот турнир основал Хью Лебнер (www.loebner.net/Prizef/loebner-prize.html). За победу в нем полагались приз в размере 100 тыс. долл. и золотая медаль.

Розыгрыш приза проводится ежегодно. Автору бота, не завоевавшего золото, но признанного жюри наиболее человекоподобным, вручается утешительный приз в размере 2000 долл. и бронзовая медаль.

Пока главный приз не достался никому. Однако в 1994 г. Лебнер внес серьезные изменения в правила, потребовав, чтобы программа общалась с судьей не только в текстовом формате, но и путем генерации изображения виртуального человека. Она также должна уметь синтезировать и распознавать речевую информацию. Эти условия многие сочли крайне трудными, и до сих пор претендентов на главный приз по новым правилам не появилось. А за победу в старом, “текстовом” режиме теперь обещаны 25 тыс. долл. и серебряная медаль. Надо отметить, что вероятность субъективной ошибки судьи при общении с программой по старым правилам достаточно высока. Кроме того, боты совершенствуются довольно-таки быстро, и мы наверняка дождемся в ближайшие годы победителя в тесте Тьюринга.

Судейство на конкурсе очень строгое. Эксперты заранее готовятся к турниру и подбирают весьма заковыристые вопросы, чтобы понять, с кем же они общаются. Их разговор с программами напоминает допрос следователя. Судьи любят, например, повторять некоторые вопросы через определенное время, так как слабые боты не умеют следить за историей диалога и их можно поймать на однообразных ответах.

Но и разработчики не теряют времени даром, настраивая своих виртуальных подопечных таким образом, чтобы на провокационные вопросы типа “вы машина или человек?” программа весьма убедительно отвечала: “Конечно, человек!”.

8 ноября 1991 г. в Бостонском компьютерном музее восемь программ вступили в схватку с живыми экспертами. Результат был ошеломляющим. Пять из десяти судей решили, что под псевдонимом Whimsical Conversation скрывается человек. На самом деле это была программа Therapist, работавшая под управлением IBM PC 386 и созданная в 1986 г. на основе легендарной ELIZA Джозефом Вейнтраубом, специалистом по психологии. Впрочем, такой результат во многом связан со скептицизмом и предубеждением экспертов, считавших, что программы общаются на гораздо более примитивном уровне, чем это было в реальности. В дальнейшем судьи освоились с компьютерной манерой общения, и столь успешного результата ботам с тех пор достичь не удалось.

Первоначально Therapist состояла из семи модулей, написанных на Си, Turbo-Prolog и QuickBasic. Позже она была дополнена системой синтеза речи и базой знаний. Программа использует словарь из 70 000 слов и запоминает все, что ей рассказывают, используя эту информацию в следующих диалогах и подстраиваясь под интересы конкретного собеседника. Therapist выигрывала приз Лебнера еще в 1992, 1993 и 1995 гг. Затем она была усилена специализированными модулями, способными поддерживать разговоры на темы “мужчина против женщины” и “либералы против консерваторов”.

Вот пример из одного ее победного диалога:

Судья: Do you think that American soldiers should go to Bosnia?

Therapist: I think that what clinton has done in sending 20,000 peacekeepers to bosnia will ensure a lasting peace.

Судья: Do you think most Americans feel the way you do?

Therapist: What did you mean when you said do you think that american soldiers should go to bosnia? Did anyone ever tell you that you think too much? Oh, I think most americans feel the way i do?

В 1994 г. победу в турнире одержал Томас Вайлен, доктор экспериментальной психологии, специализирующийся на изучении естественных языков. Его программа TIPS была обучена хранить и анализировать фразы (в базе их было несколько тысяч) и выполнять поиск по лексическим шаблонам.

В 1996 г. бронзовую медаль получил Джейсон Хатченс и его бот SEPO, который общался примерно так:

Судья: I think. I do research. I write. I love. I Live.

SEPO: I wonder whether you think sometimes! I am feeling like the judge here!

В 1997 г. чемпионом стал Дэвид Леви с ботом Converse. В 1998-м и 1999-м победы добивался Робби Гарнет, считающий, что прохождение теста Тьюринга не требует реального интеллекта. Интересно, что почти все авторы, упоминая о научных подходах к обучению (нейронные сети, генетические алгоритмы), обходились в своих решениях достаточно простыми эвристическими методами.

Гарнет выставил на состязание программу Computational Behaviorist, основанную на принципе “стимул — реакция”, схожем с тем, что заложен в TIPS и ELIZA. Только его бот искал не одно, а до трех ключевых слов в фразе. В то же время, понимая, что от программы требуется нечто большее, чем однообразный ответ на вопросы, он встроил в нее ряд дополнительных эвристических алгоритмов, создававших более полную иллюзию общения с человеком.

В ходе разработки Behaviorist возникли технические трудности, связанные со сложностью реализации поиска знаний в крупных по тем временам базах, что приводило к заметным временны’м задержкам в общении, сразу выдававшим компьютерного собеседника. Поэтому Гарнет объединил два общедоступных бота — Albert, написанный на С++, и одну из Паскаль-версий ELIZA и реализовал их в среде разработки Visual DataFlex, позволявшей пользоваться стандартными алгоритмами запросов к БД.

В 2000-м и 2001 г. малый приз доставался программе ALICE Ричарда Уоллеса. Сегодня на базе ALICE организован фонд ALICE AI Foundation (http://alice.sunlitsurf.com/), занимающийся стандартизацией деятельности по созданию ботов. В частности, ALICE дополнена средствами поддержки БД в формате AIML (Artificial Intelligence Markup Language) — подмножестве XML, нацеленном на формализацию представления ключевых фраз и ответов. Теперь любой желающий, незнакомый с программированием, может взять базовый вариант ALICE и наполнить его собственной базой знаний на любом языке, используя обычный редактор.

К сожалению, летом этого года, как сообщило издание Wired, у г-на Уоллеса начались проблемы с психикой (он угрожал одному из своих коллег-профессоров физической расправой, утверждая, что в ряде американских университетов процветает коррупция и в отношении Уоллеса преподавательским составом задуман масштабный заговор). Пока ученый находится под следствием.

Одним из наиболее вероятных претендентов на победу в текущем году (турнир пройдет в октябре) считается Смит Джошуа, автор программы Anna (AIML-расширение ALICE, свободно доступное на сайте http://annabot.sourceforge.net/). Г-н Джошуа отмечает, что в отличие от своих коллег он с самого начала создавал бот, выдающий себя в процессе общения за человека. Anna действительно считает себя живым существом, обладает набором индивидуальных качеств и достаточно бойко ведет разговор.

Есть ли подобные российские разработки — боты, способные общаться на русском языке? Редакция PC Week/RE готова провести российский конкурс на прохождение теста Тьюринга. Напишите автору по адресу: [email protected].

Статья опубликована в PC Week/RE, №35 2002 г.
Статья помещена в музей с разрешения автора 07.09.2009

Пройти через стену Тьюринга — Троицкий вариант — Наука

Альберт Ефимов

Могут ли быть разумными машины, которые способны играть в настольные игры или распознавать образы лишь в своем уютном виртуальном мире? Чтобы стать надежными и удобными помощникам людей, машинам надо научиться общаться и действовать в физической реальности, подобно людям. Этим проблемам посвящена статья Альберта Ефимова, кандидата философских наук, вице-президента, директора управления исследований и инноваций Сбера, зав. кафедрой инженерной кибернетики НИТУ «МИСиС».

Представления о наделенном искусственным разумом человекоподобном существе намного древнее, чем считают поклонники научной фантастики, приписывая идею о роботах Карлу Чапеку, который придумал этот термин в 1920-х. Предание о руко­творном существе, которое умеет всё то же, что и человек, родом из глубокой античности. Мы читаем об этом в притчах Чжуан-цзы из Древнего Китая, в древнегреческих мифах о Пигмалионе и «умных» треножниках — помощниках Гефеста. Всерьез задумался об «автоматизации» рассуждения Аристотель, описавший силлогизмы — формы логических построений, служащие элементарными «кирпичиками» рационального мышления. Еще одной важной вехой на этом пути стали работы Готфрида Лейбница, который в конце XVII века не только заложил основы математической логики, но и много рассуждал о возможностях алгоритмизации мышления.

В конце XVII века Лейбниц описал концепцию рациоцинатора (ratiocinator) — логической системы, которая позволяет выразить любые производные понятия ясным и простым способом на основе базовых элементарных концепций и строгих правил, совершая над ними операции, подобные математическим. Замысел создания такой «философской машины» был грандиозен, но в силу неразвитости техники оставался нереализованным еще много лет. Первый значительный шаг к этому был сделан лишь в 1830-х, когда Чарлз Бэббидж попробовал сконструировать аналитическую машину, механический прообраз современных программируемых компьютеров. Результат оказался не слишком успешным, однако попытки «механизировать» рассуждения не прекращались.

В 1930-х Курт Гёдель сформулировал, а затем и доказал теоремы о неполноте, согласно которым ни одна система формальной арифметики не может быть одновременно и полной, и внутренне непротиворечивой. Иначе говоря, не существует такой системы, которая позволяет доказывать или опровергать любые утверждения. На некоторое время это поставило многих специалистов в тупик. Но уже вскоре Алан Тьюринг и Алонзо Чёрч ввели понятия вычислимых (решаемых в той или иной системе) функций и показали, что все они могут быть решены не с помощью формул, а алгоритмически — например, с помощью машины Тьюринга.

Тезис Тьюринга в самой простой формулировке [1] гласит, что универсальная машина Тьюринга может выполнить любое вычисление, которое способен выполнить человек-вычислитель. Эта удивительная по простоте и глубине идея открыла путь к появлению первых компьютеров, над которыми сам Тьюринг трудился в годы Второй мировой войны. Тогда же британский ученый задумался и о создании «разумной машины» (intelligent machine) — термин «искусственный интеллект» еще не появился.

Шахматы и шифры

Многие специалисты и сегодня считают, что, прежде чем приступать к созданию искусственного интеллекта, следует выяснить природу и устройство естественного. Однако Тьюринг смотрел на проблему совершенно иначе. Он, по сути, наследовал идеям Рене Декарта, который считал живые организмы полностью автоматическими существами, полагая, что полноценное сознание и мышление свойственны лишь человеку. В такой картине мира разум человека, его интеллект отделены от реального мира как часть иной «сферы сознания». Так же и в представлениях Алана Тьюринга интеллект практически не зависел от его физического носителя.

В своей знаменитой статье 1950 года «Вычислительные машины и разум» [2] (Computing Machinery and Intelligence) он определил несколько областей, представляющих «высшие проявления» человеческого интеллекта, на моделировании которых и следовало в будущем сосредоточиться. Это изучение языков (и переводы), игры (шахматы и т. п.), математика и криптография (включая решение загадок). Если в этих сферах деятельность компьютера невозможно отличить от человеческой, рассуждал Тьюринг, то их мышления эквивалентны и можно сказать, что мы имеем дело с «разумной машиной».

Неужели Тьюринг считал, что самое важное в человеке — это уметь играть в шахматы, вести возвышенные диалоги или разгадывать криптографические загадки? Это не так. Британский математик был уверен, что для создания интеллектуальных машин, имеющих способности, сравнимые с человеческими, недостаточно просто научить машину взаимодействию с физическим миром. В своем отчете для Национальной физической лаборатории 1948 года Тьюринг писал, что такая машина «не будет иметь возможности оценить такие важные для человека вещи, как еда, спорт или секс». Признав, что, разрабатывая машину, способную к взаимодействию с реальными миром, мы идем по пути более гарантированного создания искусственного разума, Алан замечал, что в 1948-м этот путь кажется более долгим и дорогим, чем учить компьютер играть в шахматы.

Стоит сказать, что уже через пару лет после этой публикации появились «черепахи» [3] Уолтера Грея — одни из первых автономных машин современности. Весьма примитивно устроенные существа демонстрировали неожиданно «разумное» поведение и могли, например, находить свою зарядную станцию с помощью фототаксиса, ориентируясь по свету. Эта сложность рождалась в прямом взаимодействии реального мира с простейшим «сознанием» роботов, и, если бы Тьюринг писал свою статью позднее, он наверняка сформулировал бы проблему иначе.

«Википедия»

Однако именно статья, написанная более 70 лет назад, задала концептуальные основы для работы многих поколений разработчиков искусственного интеллекта. Согласно Тьюринговому подходу высокоуровневые интеллектуальные функции мозга можно воспроизвести на основе искусственной системы, компьютера, без того, чтобы имитировать систему в физическом мире. Такие представления развивал и описанный в той же статье тест.

Внутри и за стеной

В своих размышлениях над тестом Тьюринг отталкивался от викторианской «игры в имитацию». По ее условиям ведущий, обмениваясь записками с игроками, должен определить, кто из них женщина, а кто притворяется. Разумеется, «судья» при этом их не видит, от игроков его отделяет стена, непроницаемая для всего, кроме обмена символьной информацией — записочками, или, говоря по-современному, сообщениями в чате. Такое испытание можно рассматривать как «тест на интеллект» для мужчины, которому требуется имитировать «женские» (конечно, в представлениях викторианского времени) поведение и реакции. Тест Тьюринга переносил эту ситуацию на игру с компьютером, который должен имитировать живого человека, оставаясь скрытым от судьи всё той же «стеной».

Эта стена кажется обязательным элементом теста, ведь без нее мы сразу увидим, с кем имеем дело. Она скрывает физическую реальность собеседника, но при этом и сводит всё его мышление к ограниченному набору процессов. При этом даже сам герой нашего рассказа признавал, что полноценное человеческое познание мира невозможно без прямого взаимодействия с ним. Однако в то время имитация таких задач, как занятия спортом, еда или секс, казалась совершенно немыслимой, поэтому британский математик отнес их к неопределенно далекому будущему, предложив сосредоточиться на играх, языках и криптографии.

В результате Тьюринг дал старт своеобразной гонке между человеком и машиной исключительно в виртуальном пространстве. При этом идея такого теста стимулировала разработку систем, выполняющих какие-то определенные, узкие функции — будь то игра в шахматы, перевод или управление автомобилем — лучше людей и даже готовых заменить нас в той или иной области. Узость возможностей интеллектуальной машины была изначально заложена в парадигмальной идее британского математика, ограничивающей интеллект лишь простыми вербальными, символьными коммуникациями и игнорирующей все остальные модальности. Можно ли назвать интеллект, который умеет играть в шахматы, болтать и разгадывать загадки, общим? Вряд ли.

Однако до тех пор, пока робот или компьютер остается отделен от человека и от мира стеной, он не способен полноценно взаимодействовать с ними, и подлинная интеллектуальность машины подменяется сложностью реализуемых ею функций. Возможно, для беспилотного автомобиля или шахматной программы этого достаточно, но в погоне за общим искусственным интеллектом без смены парадигмы уже не обойтись: придется «ломать стену» и переходить к новой, посттьюринговой методологии [4]. Суть ее в том, что все упомянутые Тьюрингом элементы «теста» составляют единое целое и рассматриваются в комплексе: наблюдатель-судья, испытуемый (человек или компьютер) и инструмент вопрошания (стена превращается в среду взаимодействия, интерфейс между машиной и человеком).

Проверка перепиской

Для легкого объяснения можно обратиться к мысленному эксперименту «девушка по переписке», предложенному [5] Андреем Алексеевым. Допустим, юноша в поисках пары обращается к сервису знакомств через Интернет. Указав подходящие параметры (возраст, образ жизни и т. п.), он получает список пользовательниц и начинает переписку с одной из них. После долгого виртуального общения молодой человек наконец приглашает ее на свидание, лишь тогда обнаруживая, что всё это время разговаривал с программой. Такое развитие событий эквивалентно успешному прохождению искусственным интеллектом теста Тьюринга в его классической версии. Ожидая, что развитие технологий продолжится в рамках уже существующих тенденций, когда-то заданных Тьюрингом, Алексеев предположил, что «в недалеком будущем воплотится и сценарий „девушка по переписке“».

Однако можно заметить, что даже если этот сценарий и воплотится, он не имеет никакого практического смысла. Переписка «через стену Тьюринга» лишает машину возможности всестороннего полезного взаимодействия с человеком и миром. Чтобы пояснить это, представим иной вариант развития событий в том же эксперименте. Допустим, что когда дело дошло до свидания, юноша встречает свою партнершу по переписке в кафе — она вполне живая и настоящая. Однако разговор в офлайне не клеится: оказывается, у них не так много общих интересов, а остроумные и уместные реплики, которые давала девушка при переписке, ей автоматически подсказывал искусственный интеллект. Разочарованный молодой человек возвращается домой и пишет ей, что от такой встречи ему немного не по себе, но та отвечает цитатой из его любимого сериала, и переписка возобновляется.

Таким образом, стены, разделяющей машину и человека, больше не существует, она не нужна для оценки искусственного интеллекта и его взаимодействия с людьми. При этом компьютер оказывается более близким и понятным эмоционально, чем даже живая собеседница, он «более человечен, чем сам человек». В этой связи можно снова вспомнить Платона с его «вечными идеями», реализациями которых являются реальные объекты. Искусственный интеллект, не ограниченный стеной Тьюринга, может воплощать «идею интеллекта» так же, как это делает сам человек, наравне и во взаимодействии с ним. Человек знает, с кем имеет дело, и понимает, что с машиной ему лучше: интереснее, полезнее, надежнее.

После Тьюринга

Настоящая мыслящая машина должна стать продуктом разносторонних взаимодействий с человеком и окружающим миром: вербальных и невербальных, происходящих как в ­виртуальной среде, так и в реальной. Так, классический тест Тьюринга охватывает только области вербального и виртуального взаимодействия, как и схемы Терри Винограда и большинство других популярных тестов искусственного интеллекта. Это неудивительно, ведь все они находятся в заданной британским гением парадигме, «за стеной». Сломать ее — значит выйти в области невербального и реального освоения мира искусственным интеллектом.

В конце концов, сегодня мы понимаем, что определенными формами сознания обладают многие животные, включая даже головоногих моллюсков. И каждый раз мышление и его проявления оказываются связаны с реальными условиями существования, с телесностью живого существа, его моторикой. По мнению нашего выдающегося философа Давида ­Дубровского, развитие психики затронуло [6] лишь те организмы, которые активно передвигаются во внешней среде. Похоже, что полноценное познание окружающего мира в принципе невозможно без физического взаимодействия с ним. Поэтому условием создания «общего» («сильного») искусственного интеллекта будет возможность работы в различных модальностях и разных средах. Ему требуется выход в области невербального и физического.

Примерами искусственных интеллектов, которые справляются с невербальными задачами, могут служить уже существующие системы, играющие в компьютерные игры, или виртуальная телеведущая Елена [7] (созданная в Лаборатории робототехники Сбера, она полностью имитирует настоящую телеведущую, включая движения, эмоции и жесты). Однако и первые, и вторая не покидают пределов виртуального. Настоящее взаимодействие с человеком в физическом мире до сих пор остается чрезвычайно сложной задачей. Для общего искусственного интеллекта этого недостаточно: такая машина должна охватывать все четыре области взаимодействий и сред.

Пришествие техноумвельтов

Еще в XIX веке видный биолог Якоб фон Икскюль отметил, что разным живым существам свойственны разные сферы мировосприятия — умвельты. Умвельт бабочки заметно отличается от умвельта рыбы или человека. По аналогии с ними четыре области взаимодействий, возможные для машин, предлагается [8] называть техноумвельтами. Техноумвельт — домен мировосприятия, то, как машина видит окружающий мир. Умвельт человека знаком каждому из нас, а техноумвельты беспилотных автомобилей, пользующихся радарами и лидарами, многие наблюдали в видеороликах.

Описанные выше измерения взаимодействий человека и машины (вербальное — невербальное и виртуальное — физическое) дают четыре независимых техноумвельта: вербальное виртуальное, невербальное виртуальное, вербальное физическое и невербальное физическое. Универсальность общего искусственного интеллекта (AGI) возможна только при свободном перемещении машины между всеми четырьмя техноумвельтами. Текущее поколение ИИ способно распознавать объекты разного класса без предварительного обучения. Это важнейшее достижение, однако оно никак не связано с возможностью работать в разных техноумвельтах. По-видимому, для этого потребуется реализовать своего рода «переводчики» с языка, свойственного одному домену мировосприятия, на язык другого. Лишь тогда искусственный интеллект сможет стать по-настоящему мультимодальным, сумеет решать весь спектр возможных задач и полноценно «общаться» с человеком.

Его появление навсегда изменит наше взаимодействие с техникой. После тысячелетий философских размышлений и научно-технического прогресса люди впервые в истории столкнутся с по-настоящему «умными» вещами, с устройствами, которые могут обладать даже более полными и точными знаниями о мире и о нас, чем мы сами. Такая ситуация потребует нового взгляда на то, чем является человек и его разум, переопределить многие устоявшиеся представления.

Эти процессы уже начались: сегодня мы начинаем «растворяться» в окружающих нас повсюду технологиях и гаджетах, размывается само понятие «человека». По мере освоения компьютерами новых сфер деятельности, будь то шахматы или перевод, они перестают считаться исключительной прерогативой человека. Возможно, человек — это то, что машина сделать еще неспособна. Людям-инженерам по силам создать машину, которая может самостоятельно добраться из точки А в точку Б, но нужно стать философом, чтобы увидеть место, где находится эта точка Б.

1. elenph.org/vivo/individual?uri=https://litvinovg.pro/text_structures%23elenphArticle/w2phtml_shalak_mashina_tyuringa

2. ru.wikipedia.org/wiki/Вычислительные_машины_и_разум

3. en.wikipedia.org/wiki/Turtle_(robot)

4. intellekt-izdanie.osu.ru/arch/2020_2_74.pdf

5. artsoc.jes.su/s207751800007698-6-1/

6. ncbi.nlm.nih.gov/pmc/articles/PMC7179338/

7. sberbank.ru/ru/press_center/all/article?newsID=6dce28d0–186d-4822–9221–59610068bdf4&blockID=1303&regionID=77&lang=ru&type=NEWS

8. iphras.ru/uplfile/zinaida/ROOTED/aspir/autoreferat/efimov/dissertatsiya_efimov_final_151020.pdf

См. также:

Прохождение теста Тьюринга: новое определение понятия «думать»

Пропустить заголовок статьи. Перейти к: Начало статьи.

В 1950 году Алан Тьюринг предложил вопрос «Могут ли машины мыслить?» и с тех пор многие стремились пройти тест Тьюринга, целью которого является выяснить, могут ли люди различать, взаимодействуют ли они с человеком и с машиной. В прошлом месяце чат-бот по имени Юджин Густман, как сообщается, прошел тест Тьюринга, убедительно подражая 13-летнему мальчику. Сильное упражнение в анализе естественного языка, он мог понять, что используемые слова относятся к дому или пункту назначения путешествия.

Но действительно ли он понял, что имелось в виду? Учился ли Юджин в ходе взаимодействия и демонстрировал ли он навыки решения проблем, или он только имитировал понимание? Спустя 75 лет пришло время вернуться к духу вопроса Тьюринга и расширить его до «Может ли машина понимать, учиться и решать проблемы?»

Чтобы создать настоящий искусственный интеллект, машина должна сначала понимать и интерпретировать то, что имеет в виду пользователь. Например, возьмем утверждение: «Вчера Джон купил акции у Джейн». Если я спрошу человека: «Кто владеет акциями сегодня?» он или она, скорее всего, ответит: «Джон, потому что вчера он купил акции Джейн». Если вы спросите поисковую систему: «Кому сегодня принадлежат акции?» или «Кому он принадлежал на прошлой неделе?» вы бы не получили ответа. Поисковая система ответила бы только на вопрос о том, кто купил акции, а не на вопрос, кому они принадлежат.

Как только машина научилась понимать, следующим шагом будет обучение. Причина, по которой люди являются самым развитым и доминирующим видом, не в остром зрении, тонком обонянии или безупречном слухе. Это из-за интуитивной и непревзойденной способности к обучению.

Детей оценивают, проверяя их навыки чтения и понимания. Машина должна быть в состоянии пройти тест по чтению пятого класса. Он должен уметь читать руководство и отвечать на вопросы об этом руководстве.

По мере взросления детей их понимание прочитанного больше не оценивается. Теперь они должны применить свои знания для решения проблем. Это подводит нас к последнему критерию реализации настоящего машинного интеллекта. Решение проблем — самый сложный аспект любой задачи искусственного интеллекта и наиболее важная мера ценности.

Допустим, вы звоните агенту и говорите: «Я не могу получить доступ к своему банковскому счету». Это утверждение является контекстуально двусмысленным и недостаточно ясным само по себе, чтобы агент мог понять, какие корректирующие действия следует предпринять. Поэтому агент должен задавать вопросы — как машина, например: «Вы имеете в виду, что вы не можете получить доступ к своей странице перевода или вы не можете получить доступ к своей главной странице? Если вы не можете получить доступ к главной странице, вы ищете учетную запись, связанную с главной страницей, или несвязанную учетную запись? Вы добавили свой номер социального страхования?»

Теперь дело не в том, может ли машина общаться с вами или отвечать на ваши вопросы, а в том, может ли машина распознать контекст проблемы и помочь вам решить ее.

Мы должны измерять машины по тому же стандарту, по которому оценивали бы интеллект человека. Как только мы сможем заявить, что машина может понимать человеческий смысл, может учиться, наблюдая за нами, и может использовать свое понимание и навыки обучения для решения проблем, только тогда мы отдадим должное вопросу Тьюринга.

Эргун Экичи — вице-президент по новым технологиям в IPsoft.

Автор сообщения:

Ergun Ekici

Посмотреть исходное сообщение

Вернуться к началу. Перейти к: Начало статьи.

  • ИИ
  • Искусственный интеллект

Что это такое, что может пройти его и ограничения

Что такое тест Тьюринга?

Тест Тьюринга — это обманчиво простой метод определения того, может ли машина демонстрировать человеческий интеллект: если машина может вступить в разговор с человеком, не обнаруживая себя как машину, она продемонстрировала человеческий интеллект.

Тест Тьюринга был предложен в статье, опубликованной в 1950 году математиком и пионером вычислительной техники Аланом Тьюрингом. Это стало фундаментальным мотиватором в теории и развитии искусственного интеллекта (ИИ).

Ключевые выводы

  • Тест Тьюринга измеряет интеллект испытуемого, чтобы определить, может ли машина продемонстрировать интеллект.
  • Согласно тесту, компьютерная программа может думать, если ее ответы могут обмануть человека, заставив его поверить, что она тоже человек.
  • Не все признают правильность теста Тьюринга, но его прохождение остается серьезной проблемой для разработчиков искусственного интеллекта.
  • Существуют варианты теста Тьюринга, а также модификации подхода к задаванию вопросов в различных тестах ИИ.
  • Тест Тьюринга имеет несколько ограничений, включая требование контролируемой среды, отсутствие специального определения интеллекта и необходимость адаптации к развивающимся технологическим достижениям.

Понимание теста Тьюринга

Стремительный прогресс в области вычислительной техники теперь заметен во многих аспектах нашей жизни. У нас есть программы, которые переводят один язык на другой в мгновение ока, роботы, которые убирают весь дом за считанные минуты, финансовые роботы, которые создают персонализированные пенсионные портфели, и носимые устройства, которые отслеживают наше здоровье и уровень физической подготовки.

В авангарде прорывных технологий стоит развитие искусственного интеллекта и ограничения, с которыми может столкнуться компьютер. По этой причине тест Тьюринга был разработан для оценки того, может ли компьютер быть достаточно «умным», чтобы его можно было принять за человека. Критики теста Тьюринга утверждают, что можно построить компьютер, способный мыслить, но не обладающий собственным разумом. Они считают, что сложность человеческого мыслительного процесса не может быть закодирована.

Тест проводится в комнате для допросов, которой руководит судья. Испытуемые, человек и компьютерная программа, скрыты от глаз. Судья разговаривает с обеими сторонами и пытается определить, кто из них человек, а кто компьютер, основываясь на качестве их разговора. Тьюринг заключает, что если судья не может определить разницу, то компьютеру удалось продемонстрировать человеческий интеллект. То есть может думать.

История теста Тьюринга

Алан Тьюринг разработал некоторые из основных концепций информатики, когда искал более эффективный метод взлома закодированных немецких сообщений во время Второй мировой войны. После войны он начал думать об искусственном интеллекте. В своей статье 1950 года Тьюринг начал с постановки вопроса: «Могут ли машины думать?» Затем он предложил тест, призванный помочь людям ответить на этот вопрос.

Некоторые ранние компьютеры ранее заявляли о способности обманывать людей в самых простых ситуациях. В 19В 66 году Джозеф Вейценбаум создал ELIZA, машину, которая брала определенные слова и преобразовывала их в полные предложения. ELIZA была одним из первых компьютеров, обманувших человека-испытателя, заставив его думать, что это человек.

Менее чем через десять лет чат-бот PARRY был смоделирован так, чтобы имитировать поведение параноидального шизофреника. Группу психиатров попросили проанализировать разговоры с реальными пациентами и разговоры PARRY. Когда группу попросили определить, какие расшифровки были компьютерными программами, группа смогла идентифицировать машину только в 48% случаев. Критики ELIZA и PARRY заявляют, что все правила теста Тьюринга не были соблюдены, и не указывают на полный машинный интеллект.

Чат-бот по имени Юджин Густман считается первым, кто прошел тест Тьюринга в 2014 году.

Тест Тьюринга сегодня

У теста Тьюринга есть недоброжелатели, но он остается мерилом успеха проектов искусственного интеллекта. В обновленной версии теста Тьюринга более одного судьи-человека допрашивают и разговаривают с обоими субъектами. Проект считается успешным, если более 30% судей после пятиминутного разговора приходят к выводу, что компьютер — это человек.

Премия Лебнера — это ежегодный конкурс «Тест Тьюринга», который был учрежден в 1991 году Хью Лебнером, американским изобретателем и активистом. Лебнер создал дополнительные правила, требующие от человека и компьютерной программы 25-минутного разговора с каждым из четырех судей. Победителем становится компьютер, программа которого получает наибольшее количество голосов и наивысшую оценку судей.

В 2014 году Кевин Уорвик из Университета Рединга организовал соревнование по тесту Тьюринга, приуроченное к 60-летию со дня смерти Алана Тьюринга. Компьютерный чат-бот по имени Юджин Густман, представлявший собой 13-летнего мальчика, технически прошел тест Тьюринга в этом событии. Он заручился поддержкой 33% судей, которые были убеждены, что он человек.

В 2018 году Google Duplex показал возможность выполнения задач по телефону. В различных демонстрациях Duplex назначал встречу с парикмахером, а также звонил в ресторан, при этом человек на другом конце линии не осознавал, что взаимодействует с машиной. Однако критики отмечают, что взаимодействие не соответствует реальному тесту Тьюринга, и утверждают, что машина еще не прошла этот тест.

Версии теста Тьюринга

Существует несколько вариантов тестов Тьюринга, все с одной и той же целью определить, является ли респондент человеком или машиной. В каждом варианте используется свой подход к заданию респонденту разных вопросов и оценке ответов.

Игра-имитация

Одно из первых применений теста Тьюринга, имитационная версия игры, часто использует три стороны. Первым человеком был мужчина, вторым человеком была женщина, а третий человек отвечал за определение пола первых двух человек. Первому человеку часто поручают попытаться обмануть третьего человека, в то время как второму человеку часто поручают попытаться помочь третьему человеку правильно определить каждый пол.

Будущие итерации игры в имитацию превратились в то, что обе стороны пытаются обмануть третье лицо, чтобы оно неправильно определило пол. В любом случае цель игры в имитацию состоит в том, чтобы определить, можно ли одурачить следователя.

Стандартная интерпретация

Другая распространенная версия теста Тьюринга направлена ​​не на то, чтобы увидеть, можно ли обмануть компьютер, а скорее на то, может ли компьютер имитировать человека. В стандартном варианте интерпретации теста Тьюринга первый человек — это компьютер, а второй человек — человек любого пола.

В этом варианте третий человек пытается выяснить, кто из первых двух человек человек, а кто компьютер. Следователь не является испытуемым; вместо этого это компьютер пытается обмануть человека (в отличие от противоположного направления в имитационной игре). Например, ему можно задать ряд вопросов о личных финансах, чтобы определить, разумно ли ожидать его ответов в отношении поведенческих финансов.

Вымышленный Войт-Кампф в научно-фантастическом сериале-антиутопии «Бегущий по лезвию» — это игра на идее тестирования машины на предмет ее интеллектуального поведения.

Варианты теста Тьюринга

С момента создания теста Тьюринга появились более современные подходы в попытке лучше обнаруживать людей и машины. Эти вариации теста Тьюринга постоянно развиваются, чтобы поддерживать актуальность во время технического прогресса.

  • Обратный тест Тьюринга направлен на то, чтобы человек обманом заставил компьютер поверить, что он не допрашивает человека.
  • Полный тест Тьюринга включает перцептивные способности и способность испытуемого манипулировать объектами.
  • В тесте Маркуса испытуемые просматривают мультимедиа и отвечают на вопросы о потребляемом контенте.
  • The Lovelace Test 2.0 предлагает испытуемым создавать произведения искусства и проверяет их способность делать это.
  • В тесте «Минимальный интеллектуальный сигнал » испытуемым задаются только бинарные вопросы (т. е. допускаются только ответы «верно/неверно» или «да/нет»).

Ограничения теста Тьюринга

Есть много критиков теста Тьюринга, и приведенные выше варианты пытаются смягчить некоторые ограничения исходного теста Тьюринга. Тем не менее, важно помнить о недостатках теста Тьюринга и о том, где его анализ может дать сбой.

  • Тест Тьюринга требует очень контролируемой среды для выполнения. Участники теста должны быть скрыты от глаз друг друга на протяжении всего теста, но стороны должны иметь надежное средство связи.
  • Тест Тьюринга может не подходить для проверки интеллекта, поскольку разные вычислительные системы устроены по-разному. Следовательно, могут существовать врожденные, естественные ограничения того, на что способен компьютер.
  • Тест Тьюринга развивается; однако технологические достижения развиваются еще быстрее. Рассмотрим закон Мура, который утверждает быстрый рост производительности при быстром снижении стоимости. По мере того, как компьютер получает больше возможностей, исторические методы тестирования могут перестать быть подходящими, поскольку компьютеры приобретают больше человеческих возможностей.
  • Тест Тьюринга оценивает интеллект, хотя он может не подходить для оценки всех типов интеллекта. Например, компьютер может успешно обмануть следователя, основываясь на своей способности обрабатывать ответы так же, как человек. Однако на самом деле это может не указывать на эмоциональный интеллект или осведомленность; это может просто означать, что компьютер имел очень актуальный и компетентный набор кода.

Как работает тест Тьюринга?

В тесте Тьюринга следователь задает испытуемому ряд вопросов. Каждая сторона находится в отдельной зоне, поэтому физический контакт запрещен. Ответы, данные испытуемым, оцениваются на основе того, могут ли ответы различать, даст ли человек ответ или нет.

Прошла ли какая-нибудь машина тест Тьюринга?

В 2018 году Google Duplex был представлен на ежегодной ежегодной конференции разработчиков Google I/O. Машина планировала встречу в парикмахерской и общалась с ассистентом парикмахерской по телефону в рамках разговора. Хотя некоторые критики по-разному оценивают результат, некоторые считают, что Google Duplex прошел тест Тьюринга.

Может ли человек не пройти тест Тьюринга?

Да. Хотя тест Тьюринга основан на знаниях и интеллекте, он также оценивает, как даются ответы и интерпретируются ли ответы как подлые.

Например, представьте, что вас попросили ввести сумму 43 219 и 87 878. Сможете ли вы дать правильный ответ, это только часть экзамена; Тест Тьюринга оценивает, сколько времени вам потребуется, чтобы дать ответ, любые уточняющие вопросы, которые вы задаете в ответ, или понимаете ли вы, чтобы добавить и не подвергнуть две цифры. По любым ответам человека его можно принять за компьютер (т.е. если вы случайно вычли, а не прибавили цифры, это может быть компромат).

Каковы примеры вопросов теста Тьюринга?

Интересный пример потенциального вопроса теста Тьюринга может быть основан на языке и игре слов. Например, можно задать вопрос: «Чем отличается время полета от полета самолета?». Хотя этот тип вопроса может быть несправедливым для участников, не знакомых с английским языком, он также является примером способности проводить логические различия, когда один экземпляр (например, слово fly) может означать разные вещи в разных контекстах.

Другим примером вопроса теста Тьюринга часто являются бессмысленные вопросы. Такие вопросы, как «Разница между футболом и тем, что отбивающий носит шлем?» является грамматически неправильным и легко распознается человеком как не имеющее никакого смысла. Однако машина все равно может попытаться разобрать ответ.

Практический результат

Тест Тьюринга — это оценка, позволяющая определить, способна ли машина демонстрировать тот же интеллект, что и человек.