Как и в предыдущие годы, конкурс проводит резидент «Сколково» компания «Лаборатория Наносемантика».
Фото: Александр Коряков, Коммерсантъ
Личность Алана Мэтисона Тьюринга известна всем, кто смотрел фильм «Игра в имитацию» с Бенедиктом Камбербэтчем и Кирой Найтли. Однако Тьюринг был не только выдающимся криптографом, взломавшим код немецкой шифровальной машины «Энигма» во время Второй мировой войны, но и теоретиком в области искусственного интеллекта.
Многие годы исследователь посвятил поиску ответа на вопрос, может ли машина мыслить эмоционально, как человек. Для этого Тьюрингпредложил эмпирический тест, впоследствии получивший всемирную известность и названный в его честь. Впервые эта идея была высказана в статье ученого «Вычислительные машины и разум», которая вышла в 1950 году в философском журнале Mind. Смысл теста заключается в том, чтобы определить, обладает ли машина зачатками мышления.
По задумке, в «проверке» участвуют машина, человек и сторонний наблюдатель, выступающий в роли судьи. Все они разведены по разным комнатам и не видят друг друга. Тест проводится «письменно», ответы даются через определенные промежутки времени, чтобы скорость реакции не служила подсказкой. Судья должен по ответам определить, с машиной он разговаривает или с человеком. Компьютерная программа «старается» всячески его запутать, и если в конце концов он не сможет точно сказать, какие ответы далкомпьютер, а какие — человек, значит, машина победила.
Забавно, что в основу теста легла старинная игра, в которой участвовали три игрока: мужчина, женщина и ведущий, которые, не видя друг друга, отвечают записочками, которые просовывают под двери комнат, где находятся. По ответам ведущий должен определить, кто — мужчина, а кто — женщина. По мысли Тьюринга, место одного из участников игры и должен занять компьютер.
«Элиза» и PARRY
Первую программу, сумевшуюмного раз обмануть человека, написал в 1966 году американец Джозеф Вейценбаум, работавший в том же направлении, что и Тьюринг. Она называлась «Элиза» и работала на основе ключевых слов, то есть в ответах просто перефразировался вопрос. Программисты представили ее в качестве психотерапевта, и у многих пользователей возникло реальное ощущение того, что они общаются с человеком, а у некоторых даже установилась с «Элизой» эмоциональная связь.
Еще один виртуальный собеседник — электронная платформа PARRY — был создан в 1972 году при участии психиатра и программиста Кеннета Колби иполучил черты параноидного шизофреника. СPARRYтоже проводились беседы. Известно даже, что PARRY и «Элиза» общались между собой по ARPANET — первой компьютерной сети, созданной в 1969 году Минобороны США.
В эпоху первых опытов по созданию машинного интеллекта такие программы казались чем-то сверхъестественным. Впрочем, уже тогда многие ученые скептически относились к ошибкам в определении того, кто из участников — компьютер, а кто — человек: беседы были во многом бессмысленны, а английский язык для судей не всегда был родным.
Сегодня скептиков еще больше. Они справедливо считают, что благодаря программистам компьютеры «научились» говорить и писать лишь в стандартных ситуациях. Машины не могут эмоционально реагировать на вопросы на уровне сознания, как человек. Действительно, в тех местах, где нужно подумать, компьютер уклоняется от ответа. Это значит, что машина обманывает людей, манипулирует ими. У представителей мыслящего сообщества такое тоже встречается, но это далеко не единственная их способность.
Тест Тьюринга. Теперь и в России
Эпоха компьютерных ботов — программ, имитирующих поведение людей, в том числе чат-ботов, получивших в последнее время невероятное распространение, возродила интерес к тесту Тьюринга. Американский изобретатель Хью Лебнер в 1990 году даже учредил ежегодную премию по итогам теста. Золотую медаль и денежный приз$100 тыс. получит программа, которая будет использовать текст, видеоизображение и звук. Серебряная с $25 тыс. призовых достанется той программе, которая пройдет стандартный, то есть текстовый тест Тьюринга. Но пока это очень высокая планка, и борьба идет только за бронзовую медаль, на которую претендуют чат-боты, умеющие лучше других выдавать себя за людей.
В 2015 году «Лаборатория Наносемантика» (nanosemantics.ai) при поддержке фонда «Сколково» впервые организовала конкурс «Тест Тьюринга на русском языке». В нем участвовали восемь ботов и восемь судей с лингвистическим образованием, тест шел три минуты. По результатам тестирования победил бот «Соня Гусева»: за человека его приняли 47% судей.
«Мы первыми в Россииначали заниматься чат-ботами, в частности для коммерческих задач,—рассказывает генеральный директор “Наносемантики” Станислав Ашманов.— Уже в 1997 году, когда только оформился наш коллектив, мы понимали, что тема эта очень перспективная. Все мы выросли на научной фантастике, а там обязательный атрибут общества будущего — машины, которые умеют с человеком говорить. Необязательно разумные, но проявляющие какие-то проблески разума. Чтобы продвигать эту тему, мы даже создали проект III.ru, где любой человек мог бесплатно сделать своегочат-бота. В основном там дети регистрировались: им очень нравилось, что можно выбрать, это мальчик, девочка или робот, одеть его, придумать прическу и т. д. Они учили своего чат-бота разговаривать про любимую музыку, любимого персонажа».
Когда на рынке стали массово появляться все новые разработчики чат-ботов, в «Наносемантике» решили: пораорганизовать конкурс, чтобы посмотреть, кто и насколько хорошо делает чат-боты в России. За основу взяли конкурс Лебнера. «На мой взгляд, это интересное соревнование, где можно помериться силами,— считает Ашманов. — Мы как организаторы в четвертомтесте Тьюринга(turing-test.net) не участвуем, но нам очень интересно, чтобы пришло максимальное число разработчиков. А судьи — обычные пользователи. Робот победит, если независимый судья не сможет определить, что диалог с ним вел искусственный интеллект».
Каждый участник конкурса может выставить максимум трех ботов. Команда, чат-бот которой примут за человека большинство судей, получит первый приз — 200 тыс. руб. За второе и третье места организаторы обещают 125 тыс. и 75 тыс. руб. соответственно.
«В тесте Тьюринга, состоявшемся в 2012 году, программа смогла обмануть судей в 20,2% случаев, в 2015 году процент вырос до 47%,— вспоминает Станислав Ашманов.— Чат-боты постоянно совершенствуются, во-первых, за счет расширения тематик разговора, во-вторых, за счет нейронных сетей, которые позволяют лучше справляться с опечатками или переформулировками вопроса. Нейронная сеть, конечно, не решает вопрос диалога, но она улучшает качество, стабильность технологии. Пока чат-боты — диковинка, по крайней мере для старшего поколения, но скоро они станут обыденностью, как веб-сайт, мессенджер или мобильное приложение».