Тест на искусственный интеллект: Тест: Искусственный интеллект. Расширенное тестирование

Содержание

Тест Тьюринга устарел. Как проверить искусственный интеллект на разумность?

Текст Роман Фишман


Нам не обязательно знать, почему самолет летает. Но каждый пассажир хочет быть уверенным, что техника работает, как задумано. Что творится внутри искусственного интеллекта, неизвестно даже создателям подобных систем. Но люди постоянно ищут способы убедиться, что компьютерный разум действительно разумен

Самый известный способ проверить машину на «разумность» предложил один из отцов-основателей информатики Алан Тьюринг. Получивший его имя тест описан в классической статье 1950 года «Вычислительные машины и разум», хотя известно, что саму задачу ученый позаимствовал из по­пуляр­ной в викторианской Англии игры в имитацию. Суть ее состояла в том, чтобы ведущий, не видя сидящих за ширмой игроков и лишь обмениваясь с ними записками, определил, кто из них мужчина, а кто женщина. Так же, по мысли Тьюринга, можно поступить и с компьютером. Если судья, переписываясь с кем-то с помощью компьютерной консоли, примет машину за живого человека, — ​считаем, что испытание она выдержала. В самом распространенном варианте теста на разговор дается ограниченное время, а для вынесения решения необходимо решение двух из трех судей, общающихся с компьютером.

Алан Тьюринг. Британский математик, информатик, криптограф. Создатель концепции «машина Тьюринга» — ​теоретической основы любых современных вычислительных систем. Работал в Манчестерском и Кембриджском университетах. Во время Второй мировой войны нашел методы для взлома шифров военно-морского флота и высшего командования Германии. Стал одним из разработчиков первых, еще ламповых, компьютеров. В 1951 году собрал первый компьютер, способный генерировать музыку.

Американский изобретатель Хью Лёбнер организовал ежегодные соревнования на прохождение теста Тьюринга, которые проводятся с 1990 года. По условиям золотая медаль будет присуждена программе, которая выполнит задания, сформулированные с использованием визуальной и звуковой информации, а серебряная — ​за прохождение классического текстового теста. До сих пор участники добирались лишь до бронзы, вручаемой за самую убедительную попытку

Естественный путь

Испытание: ЕГЭ для роботов

Некоторые специалисты предлагают оценивать искусственный интеллект так же, как это делается с естественным: с помощью школьных экзаменов и тестов, вплоть до ЕГЭ. Таким путем движутся, в частности, разработчики из Алленовского института ИИ, нейросеть которых справилась с задачами по математике. Действительно, такие задания требуют хорошего уровня владения естественным языком и разнообразных знаний об окружающем мире. Однако даже полностью лишенная интеллекта машина может давать правильные ответы, пользуясь информацией из интернета как справочником.

Критики подобного подхода опираются на мысленный эксперимент «китайская комната», который придумал Джон Сёрл. Представим, что у нас есть полный набор инструкций о том, какой исходящий иероглиф служит подходящим ответом на любой входящий. Тогда мы сможем адекватно поддерживать диалог по переписке, не зная китайского языка и вовсе не понимая сути разговора, а просто следуя указаниям. «Китайская комната» ставит под сомнение как экзаменационный тест, так и классический тест Тьюринга.

Джон Сёрл. Американский философ, профессор Калифорнийского университета в Беркли. В 1980 году ввел в обиход термин «сильный искусственный интеллект» — ​ИИ, который может обосновывать и решать проблемы, мыслить и осознавать себя как личность. По описанию Сёрла, компьютер, обладающий сильным ИИ, «будет разумом в том же смысле, в котором человеческий разум — ​это разум».

Визуальное мышление

Испытание: картинки Шолле

Разработчик из Google Франсуа Шолле предлагает оценивать «сильный» ИИ по выполнению простых задач, связанных с абстрактным мышлением и способностями к обобщению, как в тестах на IQ. Для начала показывается пара картинок, связанных простым преобразованием: например, на одной объект показан вертикально, на другой развернут горизонтально. Компьютер должен разобраться, что за преобразование было использовано. Затем ему демонстрируют новую исходную картинку, к которой нужно дорисовать пару, используя то же преобразование.

Правда, пока что чаще не человек показывает картинки компьютеру, а наоборот. Речь идет о назойливых капчах, требующих от посетителя сайта доказать, что он не робот. Капча считается вариантом «обратного теста Тьюринга». Судьей здесь выступает компьютер, и именно он должен определить, с кем имеет дело в «диалоге». Для различения используют настолько искаженный текст или сложные визуальные образы, что пока с ними не справляются даже лучшие нейросети. По статистике, даже люди на решение капчи тратят в среднем 32 секунды.

Kuki. Чат-бот Kuki, написанный программистом Стивом Уорсвиком, ранее был известен как Mitsuku. Под этим именем он выиграл пять премий Лёбнера. Kuki притворяется 18-летней девушкой. Поболтать с ней можно во многих соцсетях и мессенджерах.


ДМИТРИЙ САЛИХОВ, Руководитель направления SBER AI

Тест Тьюринга был недееспособен с самого начала, но понятно это стало только недавно, в 2014-м, когда он был формально пройден. Притягательность теста — ​в его лаконичности: хотя строго определить интеллект не представляется возможным, простая методика может определить его наличие у машины. Однако тест упрекают в том, что он имеет дело не с интеллектом, а с поведением системы. Я бы сказал, что он испытывает понимание человеческого языка, тогда как настоящий интеллект включает и многое другое, недоступное для проверки в формате текстового общения. Но даже понимание языка можно тестировать по-разному. Формулировка Тьюринга не накладывает никаких специальных условий на формат диалога, его сложность и длительность. А именно здесь кроется основной подвох. Традиционный стиль онлайн-диалогов — ​обмен короткими репликами, чит-чат — ​легко имитируется большими языковыми моделями. Современная диалоговая система легко пройдет тест в стиле чит-чата. Но для выявления настоящего понимания нужно использовать специальные приемы, такие как языковые игры и мета-вопросы. Если бы я формулировал условия вместо Тьюринга, то обязательно бы уточнил: «Тест должны проводить подготовленные эксперты с применением методик, выявляющих понимание».

Чувство контекста

Испытание: схемы Вайногреда

Профессор Стэнфордского университета Терри Вайногред предложил тест с вопросами, которые требуют понимания взаимоотношений между объектами и окружающим миром. Например: «Приз не влезает в коричневый чемодан, потому что он слишком большой. Что здесь „он“?» Для человека правильный ответ кажется очевидным, однако мы хорошо понимаем, что такое «приз» и «чемодан», какие роли они играют в жизни. Компьютеру для этого не обойтись без общих знаний о мире и способности рассуждать.

Современные специалисты предъявляют к сильному ИИ еще более высокие требования, чем Вайногред: ИИ должен видеть контекст в информации разной модальности — ​текстовой, визуальной, звуковой. Например, предлагается, чтобы робот самостоятельно собрал шкаф из ИКЕА. Это требует понимания инструкций, соотнесения их с физическим миром и точной манипуляции реальными объектами.

Eugene Goostman. Женя Густман выиграл престижный конкурс ИИ, который провели в британском Университете Рединга в честь 60-летия со дня смерти Алана Тьюринга. На Премии Лёбнера бот не поднимался выше 4-го места. Программа Eugene Goostman, выполнившая формальные требования теста Тьюринга, вовсе не использует ИИ. Это хитроумный алгоритм, который опирается на заданные программистами схемы разговора и встроенные справочники. А главное, он умело притворяется подростком Женей, эмигрантом из Одессы, еще плохо говорящим по-английски, — ​с такого и взятки гладки.

Реальная жизнь

Испытание: кофейный эксперимент

Лучшим тестом «сильного» ИИ будет проверка способностей умной машины действовать в реальном мире — ​как минимум справиться с заданием, которое придумал для таких систем сооснователь Apple Стив Возняк. Звучит тест элементарно: надо войти в случайную кухню и, сориентировавшись здесь, самостоятельно приготовить чашку кофе. Однако такая задача лежит далеко за пределами возможностей современной робототехники и ­программирования.

Стив Возняк. Американский инженер и программист, потомок выходцев из Польши. В середине 1970-х разработал системы AppleI и AppleII, запустив революцию в области персональных компьютеров. В 1987 году покинул Apple из-за разногласий с партнерами, однако сохранил акции компании. Сегодня продолжает активную деятельность как преподаватель и филантроп, инвестор и разработчик. Член Нацио­нального зала славы изобретателей США, живая легенда и интернет-мем.

Искусственный интеллект создавался по образу и подобию человеческого мозга. Как устроены нейронные сети? Максимально простое объяснение:



Использованные источники: Материал опубликован в журнале «Цифровой океан» № 8, 2021, Donald Iain Smith / Photodisc / Getty Images, Science History Images / Alamy / Legion-media, carrollphoto / iStock.com, FranksValli (CC BY-SA), wayra / iStock.com, bunhill / iStock. com, SciePro / iStock.com, Gage Skidmore (CC BY-SA), metamorworks / iStock.com

ИИ или нет? Тест про искусственный интеллект, который должен пройти каждый

Продолжение сюжета от

Новости СМИ2

Истории

30 мая 2017

Истории

30 мая 2017

Алиса Беркана

Редактор блока «Технологии и бизнес».

Алиса Беркана

Пора расставить точки над i. Над искусственным интеллектом.

Алиса Беркана

Все, кто имеет хоть какое-то мнение по этому поводу, разбились на два лагеря. Первые считают, что искусственного интеллекта не существует, так как не ясна сама природа интеллекта человеческого. Вторые — что искусственный интеллект всё же есть, но его уровень развития сегодня находится на стадии пятилетнего ребёнка.

Сторонники второго лагеря делят искусственный интеллект на сильный и слабый (если он всё же есть). Согласно этой классификации, сильного ИИ ещё не существует, поэтому все примеры искусственного интеллекта в нашем тесте относятся к так называемому Weak AI.

Остались вопросы? Спорьте в комментариях!

Материалы по теме:

Алгоритмом — раз или шайбой в глаз: как ИИ меняет спорт

Эмоциональный труд: что останется человеку в эпоху ИИ?

Почему специалисты по ИИ так ценят видеоигры

Петербургский стартап разработал «счётчик Гейгера» для нативной рекламы

Главная технологическая повестка: куда смотрят лидеры индустрии?

  • Искусственный интеллект
  • Тесты

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1

    Что вы знаете об облачных сервисах?

  2. 2

    ТЕСТ: Ребрендомания. Заметишь ли ты, как изменились логотипы компаний?

  3. 3

    Тест: Факты о бумаге, которые вы не знали

  4. 4

    Вместо Web 3.0 у нас будет Web 2.5 — что тормозит переход к новому интернету

  5. 5

    TechTrends-дайджест: ИИ-генераторы «фейкньюс», графика игр нового поколения, «умная» модерация в Tinder

ВОЗМОЖНОСТИ

21 октября 2022

Protek Pitch Day

23 октября 2022

Соревнования по информационной безопасности «Student CTF»

23 октября 2022

MUIV. LAB

Все ВОЗМОЖНОСТИ

Новости

ФАС проверит маркетплейсы и ритейлеров после жалоб о завышенных ценах на армейское снаряжение

Лонгриды

«Снижать ожидания по зарплатам, плюшкам и красивым офисам». Каким будет отечественный геймдев в ближайшие годы

Колонки

Как переводить деньги в Европу из России в 2022 году?

Колонки

9 перспективных бизнес-идей после ухода иностранных компаний

Колонки

Тренировка памяти: советы и упражнения, которые помогут держать мозг в тонусе

Тест Тьюринга / Хабр

Итак сегодня мы поговорим о самом известном тесте для оценки говорящего бота — это тест Тьюринга.


Тест Тьюринга — эмпирический тест, идея которого была предложена Аланом Тьюрингом в статье «Вычислительные машины и разум» (англ. Computing Machinery and Intelligence), опубликованной в 1950 году в философском журнале «Mind». Тьюринг задался целью определить, может ли машина мыслить.

Стандартное звучание закона: «Если компьютер может работать так, что человек не в состоянии определить, с кем он общается — с другим человеком или с машиной, — считается, что он прошел тест Тьюринга»


Разумные, подобные человеку машины на протяжении многих десятилетий были одной из основных тем научно-фантастических произведений. С момента зарождения современной вычислительной техники умы людей занимал вопрос: можно ли построить машину, которая могла бы в чем-то заменить человека. Попыткой создать твердую эмпирическую почву для решения этого вопроса и стал тест, разработанный Аланом Тьюрингом.

Первый вариант теста, опубликованный в 1950 году, был несколько запутанным. Современная версия теста Тьюринга представляет собой следующее задание. Группа экспертов общается с неизвестным существом. Они не видят своего собеседника и могут общаться с ним только через какую-то изолирующую систему — например, клавиатуру. Им разрешается задавать собеседнику любые вопросы, вести разговор на любые темы. Если в конце эксперимента они не смогут сказать, общались ли они с человеком или с машиной, и если на самом деле они разговаривали с машиной, можно считать, что эта машина прошла тест Тьюринга.

Существуют, по крайней мере, три основных варианта теста Тьюринга, два из которых были предложны в статье «Вычислительные машины и разум», а третий вариант, по терминологии Саула Трейджера (Saul Traiger), является стандартной интерпретацией.

Наряду с тем, что существует определенная дискуссия, соответствует ли современная интерпретация тому, что описывал Тьюринг, либо она является результатом неверного толкования его работ, все три версии не считаются равносильными, их сильные и слабые стороны различаются.

Имитационная игра

Тьюринг, как мы уже знаем, описал простую игру для вечеринок, которая включает в себя минимум трех игроков. Игрок А — мужчина, игрок В — женщина и игрок С, который играет в качестве ведущего беседу, любого пола. По правилам игры С не видит ни А, ни В и может общаться с ними только посредством письменных сообщений. Задавая вопросы игрокам А и В, С пытается определить, кто из них — мужчина, а кто — женщина. Задачей игрока А является запутать игрока С, чтобы он сделал неправильный вывод. В то же время задачей игрока В является помочь игроку С вынести верное суждение.

В той версии, которую С. Г. Стеррет (S. G. Sterret) называет «Первоначальный тест на основе имитационной игры» (Original Imitation Game Test), Тьюринг предлагает, чтобы роль игрока А исполнял компьютер. Таким образом, задачей компьютера является притвориться женщиной, чтобы сбить с толку игрока С. Успешность выполнения подобной задачи оценивается на основе сравнения исходов игры, когда игрок А — компьютер, и исходов, когда игрок А — мужчина. Если, по словам Тьюринга, «ведущий беседу игрок после проведения игры [с участием компьютера] выносит неверное решение так же часто, как и после проведения игры с участием мужчины и женщины», то можно говорить о том, что компьютер разумен.

Второй вариант предложен Тьюрингом в той же статье. Как и в «Первоначальном тесте», роль игрока А исполняет компьютер. Различие заключается в том, что роль игрока В может исполнять как мужчина, так и женщина.

«Давайте рассмотрим конкретный компьютер. Верно ли то, что модифицируя этот компьютер с целью иметь достаточно места для хранения данных, увеличивая скорость его работы и задавая ему подходящую программу, можно сконструировать такой компьютер, чтобы он удовлетворительно выполнял роль игрока А в имитационной игре, в то время как роль игрока В выполняет мужчина?», — Тьюринг, 1950, стр. 442.

В этом варианте оба игрока А и В пытаются склонить ведущего к неверному решению.

Главной мыслью данной версии является то, что целью теста Тьюринга является ответ не на вопрос, может ли машина одурачить ведущего, а на вопрос, может ли машина имитировать человека или нет. Несмотря на то, что идут споры о том, подразумевался ли этот вариант Тьюрингом или нет, Стеррет считает, что этот вариант Тьюрингом подразумевался и, таким образом, совмещает второй вариант с третьим. В это же время группа оппонентов, включая Трейджера, так не считает. Но это все равно привело к тому, что можно назвать «стандартной интерпретацией». В этом варианте игрок А — компьютер, игрок В — человек любого пола. Задачей ведущего является теперь не определить кто из них мужчина и женщина, а кто из них компьютер, а кто — человек.

Тьюринг в 2012

Для организации мероприятий по празднованию в 2012 году столетия со дня рождения Тьюринга создан специальный комитет, задачей которого является донести мысль Тьюринга о разумной машине, отраженную в таких голливудских фильмах, как «Бегущий по лезвию», до широкой публики, включая детей. В работе комитета участвуют: Кевин Ворвик, председатель, Хьюма Ша, координатор, Ян Бланд (Ian Bland), Крис Чапмэн (Chris Chapman), Марк Аллен (Marc Allen), Рори Данлоуп (Rory Dunlop), победители конкурса на получение премии Лёбнера Робби Гарне и Фред Робертс (Fred Roberts). Комитет работает при поддержке организации «Женщины в технике» (Women in Technology) и Daden Ltd.

Что такое тест Тьюринга?

Что такое тест Тьюринга?

Тест Тьюринга — это обманчиво простой метод определения того, может ли машина демонстрировать человеческий интеллект: если машина может вступить в разговор с человеком, не обнаруживая себя как машину, она продемонстрировала человеческий интеллект.

Тест Тьюринга был предложен в статье, опубликованной в 1950 году математиком и пионером вычислительной техники Аланом Тьюрингом. Это стало фундаментальным мотиватором в теории и развитии искусственного интеллекта (ИИ).

Ключевые выводы

  • Тест Тьюринга измеряет интеллект испытуемого, чтобы определить, может ли машина продемонстрировать интеллект.
  • Согласно тесту, компьютерная программа может думать, если ее ответы могут обмануть человека, заставив его поверить, что он тоже человек.
  • Не все признают правильность теста Тьюринга, но его прохождение остается серьезной проблемой для разработчиков искусственного интеллекта.
  • Существуют варианты теста Тьюринга, а также модификации подхода к задаванию вопросов в различных тестах ИИ.
  • Тест Тьюринга имеет несколько ограничений, включая требование контролируемой среды, отсутствие специального определения интеллекта и необходимость адаптации к развивающимся технологическим достижениям.

Понимание теста Тьюринга

Стремительный прогресс в области вычислительной техники теперь заметен во многих аспектах нашей жизни. У нас есть программы, которые переводят один язык на другой в мгновение ока, роботы, которые убирают весь дом за считанные минуты, финансовые роботы, которые создают персонализированные пенсионные портфели, и носимые устройства, которые отслеживают наше здоровье и уровень физической подготовки.

В авангарде прорывных технологий стоит развитие искусственного интеллекта и ограничения, с которыми может столкнуться компьютер. По этой причине тест Тьюринга был разработан для оценки того, может ли компьютер быть достаточно «умным», чтобы его можно было принять за человека. Критики теста Тьюринга утверждают, что можно построить компьютер, способный мыслить, но не обладающий собственным разумом. Они считают, что сложность человеческого мыслительного процесса не может быть закодирована.

Тест проводится в комнате для допросов, которой руководит судья. Испытуемые, человек и компьютерная программа, скрыты от глаз. Судья разговаривает с обеими сторонами и пытается определить, кто из них человек, а кто компьютер, основываясь на качестве их разговора. Тьюринг заключает, что если судья не может определить разницу, то компьютеру удалось продемонстрировать человеческий интеллект. То есть может думать.

История теста Тьюринга

Алан Тьюринг разработал некоторые из основных концепций информатики, когда искал более эффективный метод взлома закодированных немецких сообщений во время Второй мировой войны. После войны он начал думать об искусственном интеллекте. В своей статье 1950 года Тьюринг начал с постановки вопроса: «Могут ли машины думать?» Затем он предложил тест, призванный помочь людям ответить на этот вопрос.

Некоторые ранние компьютеры ранее заявляли о способности обманывать людей в самых простых ситуациях. В 19В 66 году Джозеф Вейценбаум создал ELIZA, машину, которая брала определенные слова и преобразовывала их в полные предложения. ELIZA была одним из первых компьютеров, обманувших человека-испытателя, заставив его думать, что это человек.

Менее чем через десять лет чат-бот PARRY был смоделирован так, чтобы имитировать поведение параноидального шизофреника. Группу психиатров попросили проанализировать разговоры с реальными пациентами и разговоры PARRY. Когда группу попросили определить, какие расшифровки были компьютерными программами, группа смогла идентифицировать машину только в 48% случаев. Критики ELIZA и PARRY заявляют, что все правила теста Тьюринга не были соблюдены, и не указывают на полный машинный интеллект.

Чат-бот по имени Юджин Густман считается первым, кто прошел тест Тьюринга в 2014 году.

Тест Тьюринга сегодня

У теста Тьюринга есть недоброжелатели, но он остается мерилом успеха проектов искусственного интеллекта. В обновленной версии теста Тьюринга более одного судьи-человека допрашивают и разговаривают с обоими субъектами. Проект считается успешным, если более 30% судей после пятиминутного разговора приходят к выводу, что компьютер — это человек.

Премия Лебнера — это ежегодный конкурс «Тест Тьюринга», который был учрежден в 1991 году Хью Лебнером, американским изобретателем и активистом. Лебнер создал дополнительные правила, требующие от человека и компьютерной программы 25-минутного разговора с каждым из четырех судей. Победителем становится компьютер, программа которого получает наибольшее количество голосов и наивысшую оценку судей.

В 2014 году Кевин Уорвик из Университета Рединга организовал соревнование по тесту Тьюринга, приуроченное к 60-летию со дня смерти Алана Тьюринга. Компьютерный чат-бот по имени Юджин Густман, представлявший собой 13-летнего мальчика, технически прошел тест Тьюринга в этом событии. Он заручился поддержкой 33% судей, которые были убеждены, что он человек.

В 2018 году Google Duplex показал возможность выполнения задач по телефону. В различных демонстрациях Duplex назначал встречу с парикмахером, а также звонил в ресторан, при этом человек на другом конце линии не осознавал, что взаимодействует с машиной. Однако критики отмечают, что взаимодействие не соответствует реальному тесту Тьюринга, и утверждают, что машина еще не прошла этот тест.

Версии теста Тьюринга

Существует несколько вариантов тестов Тьюринга, все с одной и той же целью определить, является ли респондент человеком или машиной. В каждом варианте используется свой подход к заданию респонденту разных вопросов и оценке ответов.

Имитация игры

Одно из первых применений теста Тьюринга, имитационная версия игры, часто использует три стороны. Первым человеком был мужчина, вторым человеком была женщина, а третий человек отвечал за определение пола первых двух человек. Первому человеку часто поручают попытаться обмануть третьего человека, в то время как второму человеку часто поручают попытаться помочь третьему человеку правильно определить каждый пол.

Будущие итерации игры в имитацию превратились в то, что обе стороны пытаются обмануть третье лицо, чтобы оно неправильно определило пол. В любом случае цель игры в имитацию состоит в том, чтобы определить, можно ли одурачить следователя.

Стандартная интерпретация

Другая распространенная версия теста Тьюринга направлена ​​не на то, чтобы увидеть, можно ли обмануть компьютер, а скорее на то, может ли компьютер имитировать человека. В стандартном варианте интерпретации теста Тьюринга первый человек — это компьютер, а второй человек — человек любого пола.

В этом варианте третий человек пытается выяснить, кто из первых двух человек человек, а кто компьютер. Следователь не является испытуемым; вместо этого это компьютер пытается обмануть человека (в отличие от противоположного направления в имитационной игре). Например, ему можно задать ряд вопросов о личных финансах, чтобы определить, разумно ли ожидать его ответов в отношении поведенческих финансов.

Вымышленный Войт-Кампф в научно-фантастическом сериале-антиутопии «Бегущий по лезвию» — это игра на идее тестирования машины на предмет ее интеллектуального поведения.

Варианты теста Тьюринга

С момента создания теста Тьюринга появились более современные подходы в попытке лучше обнаруживать людей и машины. Эти вариации теста Тьюринга постоянно развиваются, чтобы поддерживать актуальность во время технического прогресса.

  • Обратный тест Тьюринга направлен на то, чтобы человек обманом заставил компьютер поверить, что он не допрашивает человека.
  • Полный тест Тьюринга включает способности восприятия и способность испытуемого манипулировать объектами.
  • В тесте Маркуса испытуемые просматривают мультимедиа и отвечают на вопросы о потребляемом контенте.
  • The Lovelace Test 2.0 заставляет испытуемых создавать произведения искусства и проверяет их способность делать это.
  • В тесте «Минимальный интеллектуальный сигнал » испытуемым задаются только бинарные вопросы (т. е. допускаются только ответы «верно/неверно» или «да/нет»).

Ограничения теста Тьюринга

Есть много критиков теста Тьюринга, и приведенные выше варианты пытаются смягчить некоторые ограничения исходного теста Тьюринга. Тем не менее, важно помнить о недостатках теста Тьюринга и о том, где его анализ может дать сбой.

  • Для проведения теста Тьюринга требуется строго контролируемая среда. Участники теста должны быть скрыты от глаз друг друга на протяжении всего теста, но стороны должны иметь надежное средство связи.
  • Тест Тьюринга может не подходить для проверки интеллекта, поскольку разные вычислительные системы устроены по-разному. Следовательно, могут существовать врожденные, естественные ограничения того, на что способен компьютер.
  • Тест Тьюринга развивается; однако технологические достижения развиваются еще быстрее. Рассмотрим закон Мура, который утверждает быстрый рост производительности при быстром снижении стоимости. По мере того, как компьютер получает больше возможностей, исторические методы тестирования могут перестать быть подходящими, поскольку компьютеры приобретают больше человеческих возможностей.
  • Тест Тьюринга оценивает интеллект, хотя он может не подходить для всех типов интеллекта. Например, компьютер может успешно обмануть следователя, основываясь на своей способности обрабатывать ответы так же, как человек. Однако на самом деле это может не указывать на эмоциональный интеллект или осведомленность; это может просто означать, что компьютер имел очень актуальный и компетентный набор кода.

Как работает тест Тьюринга?

В тесте Тьюринга следователь задает испытуемому ряд вопросов. Каждая сторона находится в отдельной зоне, поэтому физический контакт запрещен. Ответы, данные испытуемым, оцениваются на основе того, могут ли ответы различать, даст ли человек ответ или нет.

Прошла ли какая-нибудь машина тест Тьюринга?

В 2018 году Google Duplex был представлен на ежегодной ежегодной конференции разработчиков Google I/O. Машина планировала встречу в парикмахерской и общалась с ассистентом парикмахерской по телефону в рамках разговора. Хотя некоторые критики по-разному оценивают результат, некоторые считают, что Google Duplex прошел тест Тьюринга.

Может ли человек не пройти тест Тьюринга?

Да. Хотя тест Тьюринга основан на знаниях и интеллекте, он также оценивает, как даются ответы и интерпретируются ли ответы как подлые.

Например, представьте, что вас попросили ввести сумму 43 219 и 87 878. Сможете ли вы дать правильный ответ, это только часть экзамена; Тест Тьюринга оценивает, сколько времени вам потребуется, чтобы дать ответ, любые уточняющие вопросы, которые вы задаете в ответ, или понимаете ли вы, чтобы добавить и не подвергнуть две цифры. По любым ответам человека его можно принять за компьютер (т.е. если вы случайно вычли, а не прибавили цифры, это может быть компромат).

Каковы примеры вопросов теста Тьюринга?

Интересный пример потенциального вопроса теста Тьюринга может быть основан на языке и игре слов. Например, можно задать вопрос: «Чем отличается время полета от полета самолета?». Хотя этот тип вопроса может быть несправедливым для участников, не знакомых с английским языком, он также является примером способности проводить логические различия, когда один экземпляр (например, слово fly) может означать разные вещи в разных контекстах.

Другим примером вопроса теста Тьюринга часто являются бессмысленные вопросы. Такие вопросы, как «Разница между футболом и тем, что отбивающий носит шлем?» является грамматически неправильным и легко распознается человеком как не имеющее никакого смысла. Однако машина все равно может попытаться разобрать ответ.

Практический результат

Тест Тьюринга — это оценка, позволяющая определить, способна ли машина демонстрировать тот же интеллект, что и человек. В настоящее время существует множество вариантов теста Тьюринга, и по мере развития технологий могут потребоваться новые решения для определения интеллекта.

Тест Тьюринга в ИИ — Javatpoint

следующий →
← предыдущая

В 1950 году Алан Тьюринг представил тест, чтобы проверить, может ли машина думать как человек или нет, этот тест известен как тест Тьюринга. В этом тесте Тьюринг предположил, что компьютер можно назвать разумным, если он может имитировать реакцию человека в определенных условиях.

Тест Тьюринга был представлен Тьюрингом в его статье 1950 года «Вычислительные машины и интеллект», в которой рассматривался вопрос «Может ли машина думать?»

Тест Тьюринга основан на игре для вечеринок «Игра в имитацию» с некоторыми модификациями. В этой игре участвуют три игрока, в которых один игрок — компьютер, другой игрок — человек-ответчик, а третий игрок — человек-дознаватель, который изолирован от двух других игроков, и его задача — найти среди двух из них, какой из игроков — машина.

Допустим, игрок А — компьютер, игрок Б — человек, а игрок С — следователь. Следователь знает, что один из них — машина, но ему необходимо определить это на основании вопросов и их ответов.

Разговор между всеми игроками осуществляется через клавиатуру и экран, поэтому результат не зависит от способности машины преобразовывать слова в речь.

Результат теста зависит не от каждого правильного ответа, а только от того, насколько его ответы похожи на ответы человека. Компьютеру разрешено делать все возможное, чтобы заставить следователя провести неправильную идентификацию.

Вопросы и ответы могут быть такими:

Следователь: Вы компьютер?

PlayerA (компьютер): Нет

Опросчик: Умножьте два больших числа, например (256896489*456725896)

Игрок А: Долгая пауза и дайте неверный ответ.

В этой игре, если следователь не может определить, где машина, а где человек, то компьютер успешно проходит тест, и говорят, что машина разумна и может думать как человек.

«В 1991 году нью-йоркский бизнесмен Хью Лебнер объявляет призовой конкурс, предлагая приз в размере 100 000 долларов за первый компьютер, который пройдет тест Тьюринга. Однако на сегодняшний день ни одна программа ИИ не приблизилась к прохождению теста Тьюринга в чистом виде».

чат-бота для прохождения теста Тьюринга:

ELIZA: ELIZA — компьютерная программа для обработки естественного языка, созданная Джозефом Вейценбаумом. Он был создан, чтобы продемонстрировать возможность общения между машиной и человеком. Это был один из первых чатботов, которые попытались пройти тест Тьюринга.

Парри: Парри — болтун, созданный Кеннетом Колби в 1972 году. Парри был разработан для имитации человека с параноидальной шизофренией 9.0079 (самое распространенное хроническое психическое расстройство). Парри описывали как «ЭЛИЗА с характером». Парри был протестирован с использованием варианта теста Тьюринга в начале 1970-х годов.

Eugene Goostman: Eugene Goostman — чат-бот, разработанный в Санкт-Петербурге в 2001 году. Этот бот участвовал в различных тестах Тьюринга. В июне 2012 года на мероприятии Густман выиграл конкурс, объявленный крупнейшим в истории тестом Тьюринга, в котором он убедил 29% судей, что это был человек. Густман был похож на 13-летнего виртуального мальчика.

Китайская комната Аргумент:

Было много философов, которые действительно не соглашались с полной концепцией искусственного интеллекта. Самым известным аргументом в этом списке был « китайский номер ».

В 1980 году Джон Сирл представил мысленный эксперимент « Китайская комната » в своей статье « Разум, мозг и программа », которая противоречила действительности теста Тьюринга. Согласно его аргументам, « Программирование компьютера может заставить его понимать язык, но оно не приведет к реальному пониманию языка или сознания в компьютере».0079 .»

Он утверждал, что такие Машины, как ЭЛИЗА и Пэрри, могли легко пройти тест Тьюринга, манипулируя ключевыми словами и символами, но они не имели реального понимания языка. Так что это нельзя описать как «мыслительную» способность машины, такой как человек.

Характеристики, необходимые машине для прохождения теста Тьюринга:

  • Обработка естественного языка: NLP требуется для общения с Interrogator на обычном человеческом языке, таком как английский.
  • Представление знаний: Для хранения и извлечения информации во время теста.
  • Автоматическое рассуждение: Чтобы использовать ранее сохраненную информацию для ответов на вопросы.
  • Машинное обучение: Для адаптации к новым изменениям и обнаружения общих закономерностей.
  • Зрение (для полного теста Тьюринга): Распознавание действий следователя и других объектов во время теста.
  • Управление двигателем (для общего теста Тьюринга): Воздействовать на объекты по запросу.

Следующая темаАлгоритмы поиска

← предыдущая
следующий →

Тест Тьюринга в искусственном интеллекте

Тест Тьюринга был разработан Аланом Тьюрингом (компьютерщиком) в 1950 году. Он предположил, что «Тест Тьюринга используется для определения того, может ли компьютер (машина) думать разумно, как люди»?

Представьте себе игру с тремя игроками, двумя людьми и одним компьютером, следователь (как человек) изолирован от двух других игроков. Задача следователя состоит в том, чтобы попытаться выяснить, кто из них человек, а кто компьютер, задавая вопросы обоим. Чтобы усложнить задачу, компьютер пытается заставить следователя ошибиться. Другими словами, компьютеры будут стараться быть максимально неотличимыми от людей.
 

«Стандартная интерпретация» теста Тьюринга, в котором игроку С, следователю, дается задача определить, кто из игроков — А или В — компьютер, а кто человек. Следователь может использовать только ответы на письменные вопросы для принятия решения.
А (Компьютер): Нет

C: Умножить одно большое число на другое, 158745887 * 56755647
A: После долгой паузы неверный ответ!

C: Добавить 5478012, 4563145
A: (Пауза около 20 секунд, а затем дать ответ) 10041157 

тест и машина (компьютер) считаются такими же интеллектуальными, как человек. Другими словами, компьютер считался бы разумным, если бы его разговор нельзя было легко отличить от разговора человека. Весь разговор будет ограничен только текстовым каналом, таким как компьютерная клавиатура и экран.

Он также предположил, что к 2000 году компьютер «сможет играть в имитацию настолько хорошо, что средний следователь будет иметь не более 70% шансов правильно идентифицировать (машину или человека) через пять минут. допроса». Ни один компьютер не приблизился к этому стандарту.

Но в 1980 году г-н Джон Сирл предложил «аргумент китайской комнаты ». Он утверждал, что тест Тьюринга нельзя использовать для определения того, «считается ли машина такой же разумной, как люди». Он утверждал, что любая машина, подобная ELIZA и PARRY, может легко пройти тест Тьюринга, просто манипулируя символами, которые они не понимают. Без понимания их нельзя было бы назвать «думающими» в том же смысле, что и люди. Мы обсудим это в следующей статье.
 

В 1990 году бизнесмен из Нью-Йорка Хью Лебнер объявляет о присуждении премии в размере 100 000 долларов за первую компьютерную программу, прошедшую тест. однако ни одна программа искусственного интеллекта до сих пор не приблизилась к прохождению чистого теста Тьюринга. дизайн для личного помощника, отношения с клиентами, видеоигры и анкеты, известные как слабый искусственный интеллект. Он состоит из небольшого алгоритма и источника данных. Алгоритм и источник данных, связанных с данными, связанными со сферой услуг, некоторые из слабых примеров ИИ: a.Amazon Alexa b. РЖД Диша c. Сири от Apple.

  • Сильный искусственный интеллект: Это система, которая выполняет задачи, непосредственно выполняемые людьми, такие как вождение автомобиля. Этот тип задач является более сложным и рассматривается в рамках сложной системы. Они запрограммированы на то, чтобы справляться с ситуациями, в которых решение может быть ситуационным изменением или непредсказуемым. Такие системы разрабатываются под сильным ИИ, и тестирование этих систем очень сложно, но очень полезно для людей. Эта классификация ИИ способна заменить ручную человеческую оперативную задачу запрограммированной машиной.