Искусственный интеллект читает мысли

Как ИИ может помочь в сферах, связанных с эмоциями и мыслями

Искусственный интеллект (ИИ) может применяться не только при анализе данных, распознавании лиц и многих других процессах, но и работать с более тонкими материями. Это, например, распознавание эмоций или анализ сигналов мозга для помощи парализованным людям в написании текста. Однако многие ученые сомневаются в эффективности подобных систем, а также ставят под сомнение этичность сбора и использования данных об эмоциях людей.

ПО по распознаванию лиц

ПО по распознаванию лиц

Фото: Damir Sagolj / Reuters

ПО по распознаванию лиц

Фото: Damir Sagolj / Reuters

ИИ для чтения мыслей

Ученые и разработчики создают все более сложные нейрокомпьютерные интерфейсы — системы, предназначенные для обмена информацией между мозгом человека и компьютером. Одной из последних разработок такого рода стал проект ученых Стэнфордского университета в Калифорнии: они создали ИИ, который может интерпретировать сигналы мозга человека, представляющего, как он ручкой пишет различные слова, и переводить их в текст. По замыслу разработчиков такая система может использоваться парализованными людьми: с ее помощью они смогут набирать тексты.

Речь в этом случае идет об искусственной нейронной сети: ученые имплантировали две сенсорные матрицы в мозг парализованного 65-летнего американца, каждая матрица получает сигналы примерно от 100 нейронов мозга из примерно 100 млрд нейронов человеческого мозга. Когда человек представляет, как он пишет текст ручкой на бумаге, сигналы мозга поступают в искусственную нейронную сеть, алгоритмы анализируют их и выдают соответствующие буквы и слова.

Как отмечают авторы исследования, несмотря на то, что при большинстве человеческих движений задействованы тысячи и миллионы нейронов, сигналов с 200 нейронов достаточно для точного определения, что именно хочет написать человек. Сложность создания такой системы состоит в том, что здесь нельзя использовать машинное обучение на огромных массивах данных, как это делается в других случаях, так как таких массивов данных просто нет — иначе людям, участвующим в проекте, пришлось бы мысленно писать тысячи и десятки тысяч текстов. Вместо этого нейронную сеть учат на примерах сигналов мозга при написании отдельных букв конкретным человеком.

Парализованный пациент представляет, что пишет буквы алфавита, сенсоры, имплантированные в его мозг, принимают сигналы, а алгоритмы ИИ выдают на экран соответствующие буквы

Парализованный пациент представляет, что пишет буквы алфавита, сенсоры, имплантированные в его мозг, принимают сигналы, а алгоритмы ИИ выдают на экран соответствующие буквы

Фото: Frank Willett / Stanford Medicine

Парализованный пациент представляет, что пишет буквы алфавита, сенсоры, имплантированные в его мозг, принимают сигналы, а алгоритмы ИИ выдают на экран соответствующие буквы

Фото: Frank Willett / Stanford Medicine

Такой способ позволяет писать 90 знаков в минуту, то есть почти как при печати на смартфоне, где человек набирает в среднем 115 знаков в минуту, или при написании текста вручную (около 120 знаков в минуту). Точность такого набора составляет 94,1%, а при подключении автокорректора — более 99%. Пока что ученые не создали универсальную систему, которая таким образом могла бы помогать писать разным парализованным людям, но продолжают работу в этом направлении.

Притом этот метод быстрее и проще других сходных систем, основанных на отслеживании движений глаз или головы. «Если вы используете отслеживание движения глаз для работы за компьютером, ваши глаза привязаны к тому, что вы делаете. Вы не можете посмотреть вверх, оглянуться или сделать что-то еще. Наличие такого дополнительного канала ввода может оказаться действительно важным»,— считает один из участников исследования, профессор нейрохирургии и нейрологии Стэнфордского университета Джейми Хендерсон.

Еще одна похожая, хотя и менее масштабная разработка — исследование ученых из финского Университета Аалто, создавших ИИ-систему, которая научилась воспроизводить то, как человек печатает на клавиатуре, включая ошибки и особенности печати. «Есть некоторые выборы, которые мы делаем, так что, видимо, человеческий мозг таким образом оптимизирует процесс, когда мы печатаем. Я хотел сделать то же самое с использованием компьютерного ПО, затем оптимизировать его и посмотреть, будет ли его поведение похоже на человеческое»,— рассказывает исследователь Юсси Йокинен.

Ученые создали такую систему, применив знания о человеческом поведении при печатании текста на смартфоне. В итоге созданная система набирала текст со скоростью, близкой к скорости печати человеком, количество ошибок и исправлений также было сходно. Цель создания такого ИИ — возможность быстрого тестирования новых интерфейсов, клавиатур и т. д. «Я надеюсь, что дизайнеры смогут использовать этот инструмент, чтобы быстро оценить свои идеи и проверить на моделях, как бы пользователи печатали, если бы им дали эту клавиатуру»,— отмечает господин Йокинен.

ИИ, который определяет эмоции

Еще одно перспективное направление применения ИИ — использование его для распознавания эмоций людей. Одна из подобных ИИ-систем — разработанное гонконгской компанией Find Solution AI ПО под названием 4 Little Trees. Эта система, основанная на применении искусственного интеллекта, может по выражению лица, микродвижениям, голосу, движению глаз и другим параметрам определять такие эмоции, как радость, грусть, гнев, страх, удивление, усталость, стресс, а также замечать снижение концентрации и внимания. По сути, такая система — расширенная версия систем для распознавания лиц, которая, впрочем, распознает не просто черты лица, а выделяет различные признаки разных эмоций.

ПО 4 Little Trees, разработанное гонконгской компанией Find Solution AI для распознавания эмоций людей

ПО 4 Little Trees, разработанное гонконгской компанией Find Solution AI для распознавания эмоций людей

Фото: Find Solution AI / youtube.com

ПО 4 Little Trees, разработанное гонконгской компанией Find Solution AI для распознавания эмоций людей

Фото: Find Solution AI / youtube.com

В прошлом году, когда во время пандемии школы перешли на дистанционное обучение, 4 Little Trees получило популярность в гонконгских школах: ПО уже используют в 84 местных учебных заведениях. Приложение регулярно отправляет учителям отчеты об эмоциональном состоянии учеников и присылает самим школьникам предупреждения, если видит, что они стали менее внимательны.

«Во время пандемии технологические компании продвигают свое ПО для распознавания эмоций как способ удаленного контроля за работниками и школьниками. Сходные инструменты рекламируются как возможность наблюдения за сотрудниками при удаленной работе и уже используются при удаленных собеседованиях. Распознавание эмоций окажет большое влияние в мире: от рабочих мест и школ до общественных пространств»,— считает Кейт Кроуфорд, соосновательница исследовательского института AI Now Institute, работающего при Нью-Йоркском университете и изучающего социальные последствия внедрения ИИ.

Разработками в сфере распознавания эмоций занимаются многие компании по всему миру, в том числе Amazon, Microsoft и Google. Иногда подобные системы применяются довольно неожиданным образом — так, например, Disney использовала такое ПО для анализа реакций зрителей на разные выпускаемые ею фильмы: от «Звездных войн» до «Зверополиса». Американская маркетинговая компания Kantar Millward Brown сходным образом использовала ИИ для того, чтобы определить, какие эмоции испытывают люди, видящие рекламу Coca-Cola, Intel или других брендов. Автопроизводители, в том числе Ford, BMW и Kia, в свою очередь, работают над системами, которые могли бы оценивать, не снизилась ли внимательность человека, находящегося за рулем. Особенно популярны такие системы у рекрутинговых компаний: такое ПО применяется в числе прочего американской HireVue и британской Human. Интересуются такими разработками и правительства, которые хотят эффективнее выявлять подозрительных лиц. В целом же рынок систем распознавания эмоций, по подсчетам исследовательской компании Markets and Markets, оценивается по состоянию на 2020 год в $19,5 млрд — а к 2026 году он должен удвоиться, до $37,1 млрд.

Факторизованные вариационные автоэнкодеры для моделирования реакции аудитории на фильмы

Факторизованные вариационные автоэнкодеры для моделирования реакции аудитории на фильмы

Фото: Disney Research

Факторизованные вариационные автоэнкодеры для моделирования реакции аудитории на фильмы

Фото: Disney Research

Как и в случае с ПО для распознавания лиц, к системам для распознавания эмоций есть много вопросов — может быть, даже больше. Многие ученые сомневаются, что существующее сейчас подобное ПО может корректно распознавать эмоции. С 2019 года группа ученых из американской Ассоциации психологии изучала более тысячи исследований на эту тему, в итоге они пришли к выводу, что эмоции выражаются у разных людей множеством разных способов, что затрудняет создание системы, которая бы точно определяла те или иные эмоции. «Невозможно с уверенностью сделать вывод о счастье по улыбке, о гневе — по насупленному виду, о грусти — по нахмуренным бровям, как пытаются делать большинство нынешних технологий, применяя то, что ошибочно считается научными фактами»,— считают они.

Ситуацию усложняет и то, что в разных регионах и культурах одни и те же эмоции могут проявляться по-разному, более или менее выраженно и т. д.

Есть и сомнения в этой технологии с точки зрения конфиденциальности информации, а также общей этичности сбора и использования таких данных об эмоциях других людей. «Изучив историю и шаткую научную основу таких инструментов, я убеждена, что их нужно жестко регулировать. Во многих случаях мы не можем в полной мере знать, как многие компании используют эти инструменты, так как они часто используются без должной прозрачности и без информированного согласия»,— считает госпожа Кроуфорд.

Яна Рождественская

Картина дня

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...