Artificial Intelligence

После того, как Роман Мазуренко, близкий друг Евгении Куйды, погиб в автокатастрофе, она решила возвести ему памятник. Она собрала все текстовые сообщения, которые он ей отправлял, и убедила его родных и близких сделать то же самое. Евгения, разработчик ПО по профессии, собрала более 8000 строк текста, которые рассказывали об интересах, мыслях и личности Мазуренко. Эти материалы помогли в обучении нейронной сети, которая разговаривает как Мазуренко и реагирует на сообщения так, как будто он сам на них отвечает.

Бот Roman был запущен на платформе чат-бота Luka, другого бота Евгении, в 2016 году. Пользователям нужно просто добавить @Roman и они смогут поговорить с симуляцией, узнать о жизни и карьере Мазуренко, узнать его характер. Ритм речи и виды ответов во всех деталях повторяют речь Романа. Это — экспериментальный памятник, цифровая копия, призрак. В статье на Facebook Евгения назвала эту беседу с ботом «разговором с тенью человека».

По ее словам, технология не идеальна — часто @Roman говорит что-то бессмысленное — однако то, что сделала ее команда, «было невозможно всего год назад, и в ближайшем будущем они смогут сделать еще больше».

К вопросу о телефонах: сможем ли мы услышать голоса наших умерших близких?

В 2018 году Google представила систему Duplex — ИИ-систему для выполнения реальных задач по телефону. Duplex использует рекуррентную нейронную сеть (RNN) и автоматизированную систему распознавания речи Google для эффективного взаимодействия бизнеса и пользователей.


Самое впечатляющее и, для некоторых, неудобное — это манера речи Google Duplex. Google наделила ИИ-помощник междометиями типа «хмм» и «эмм», которые имитируют паузы и интонации естественной речи, из-за этого Google Duplex звучит более человечно, чем обычный автоматический звонок. Когда Google впервые продемонстрировала эту технологию, многие люди были недовольны тем, что Duplex вводит людей в заблуждение: они думают, что разговаривают с человеком, а не с машиной.

Если у бота Евгении Куйды получилось сымитировать текстовые сообщения покойного друга, чего можно добиться с помощью технологии Google Duplex? Компания подчеркнула, что система не будет вводить пользователя в заблуждение во время звонков. Тем не менее, кажется, наступил важный этап в сфере синтеза искусственной речи. Может ли ИИ научиться имитировать ритм и манеру речи конкретных людей? Сможем ли мы услышать голоса наших умерших близких?


Идея сохранения личности человека через его речь не нова. В эссе 1878 года Томас Эдисон провозгласил, что его фонограф — первое устройство для воспроизведения записанного звука — «уничтожит время и пространство и сохранит нашу речь для потомков».

Время и пространство еще не уничтожены, однако речь действительно сохранилась. Стали возможны исследования антрополога Джона Пибоди Харрингтона, в ходе которого на восковых цилиндрах записывалась речь коренных жителей Калифорнии. Стал возможен проект BBC Voices, архив лингвистического ландшафта разных стран. Мы уже давно записываем речь разных людей, сохраняя их личности для истории.

Последние несколько лет Институт творческих технологий Университета Южной Калифорнии активно сотрудничает с Фондом Шоа. В рамках проекта The New Dimensions in Testimony (NDT) создано больше десятка «интерактивных биографий» выживших жертв Холокоста, сделанные на основе множества интервью, снятых в студии со специальным круговым освещением. Рассказы каждого участника используется для создания цифровой проекции, которая благодаря технологии синтезирования естественного языка может отвечать на вопросы аудитории.

Пинхас Гуттер на съемках проекта New Dimensions in Testimony

Если вы спросите человека, пережившего Холокост, о том, верит ли он в Бога или как скрывался от нацистов, система подберет соответствующий вашему вопросу раздел интервью. Цель состоит в том, чтобы эти фрагменты интервью создавали впечатление личной беседы со свидетелем исторических событий. «Через много лет, когда последние выжившие жертвы Холокоста нас покинут, этот проект предоставит ценную возможность встретиться с выжившими и задать им вопросы напрямую», — считают сотрудники Института Шоа.


Интерактивные системы уже представлены в нескольких музеях. Музей Холокоста штата Иллинойс построил отдельный зал, посвященный этому проекту, в рамках центра Take a Stand. Институт Шоа в США создал похожую систему, построенную на интервью выживших при Нанкинской резне. Институт креативных технологий Университета Южной Калифорнии в сотрудничестве с армией США использовал эти технологии в своем проекте: солдаты могут задать вопросы жертвам сексуального насилия. Я спрашиваю Дэвида Траума, одного из лидеров проекта, используют ли они Google Duplex. Поможет ли речь, сделанная с помощью Google Duplex, сделать «интерактивные биографии» еще более убедительными?

« В проекте NDT мы используем записанную речь — этот подход обеспечивает качество и подлинность», — говорит он. «Подход с использованием синтезированной речи обладает другим преимуществом — с его помощью можно создавать контент дешево и без доступа к рассказчику. Важно создавать новый контент: например, записывать конкретные ответы на вопросы, на которые человек не ответил во время записи».

Система с генерацией ответов более гибкая, однако Траум предупреждает, что есть вероятность сгенерировать то, что реальный человек не сказал бы: «Невозможно узнать, как ответил бы на этот вопрос сам человек. Подлинность важна, поэтому не стоит размывать эту грань».

Вирджиния Дигнум, доцент Технологического университета Делфта, активно изучает социальную составляющую искусственного интеллекта. Она согласна с Траумом: «Мне кажется, что имитирующие людей ИИ не должны придумать ответы на все вопросы. Система должна понимать пределы своего «знания».

ИИ может напоминать человека. Тем не менее, ИИ — всего лишь модель его личности.

«Если человек во время интервью не сказал, какой у него любимый цвет, система не должна придумывать ответ, например, на основе цвета его одежды. Пользователю должно быть ясно, что симуляция предназначена для обсуждения конкретной темы».

Цели таких проектов — исключительно исторические. Через эти интервью такие проекты дают зрителям представление о таких событиях, как Холокост и Нанкинская резня. Когда речь идет о непосредственной теме проекта, система четко понимает, что она «знает» об этих людях. Но можно ли построить систему, которая даст более общее представление о человеке? О его страхах, желаниях, самых сокровенных чувствах?

«Люди могут попытаться разработать такие системы, чтобы “эмоционально заменить” умерших близких», — говорит Дигнум. «Не думаю, что это нужно запретить. Если подобное направление развивается, то к нему нужно относиться как к лекарствам: тщательно исследовать с этической, психологической и социальной точек зрения».


В 2017 году Евгения Куйда выпустила приложение Replika, которое позволяет пользователям разговаривать с ботами. В ходе обмена сотнями текстовых сообщений система распознает ваше отношение к различным темам: информация проходит через нейронную сеть, которая распознает ваш тон и отношение к различным ситуациям. «Поговорите с тем, кто точно вас выслушает», — предлагают создатели. Они считают, что Replika — «безопасное пространство для обмена мыслями и чувствами, где никто тебя не осудит».

В основе приложения тот же самый подход, что Евгения применяла при создании памятника покойному другу. Разница в том, что система учится на ходу, создавая копию вашей личности, исходя из ответов на вопросы. Как сказала Евгения Куйда о ее версии Романа Мазуренко, результат — всего лишь тень личности. Бот может напоминать человека. Тем не менее, бот — всего лишь модель его личности. Что будут чувствовать наши близкие, общаясь с таким ботом, когда нас уже не будет в живых?

Это очень важно обсудить. В японском городе Оцучи есть отключенный телефон в стеклянной кабинке — телефон ветра, как его называют. Он был построен садовым дизайнером Итару Сасаки после смерти его двоюродного брата в 2010 году. В 2011 году 10 процентов населения города Отцучи погибли при наводнении, вызванном цунами, и Сасаки открыл «телефон ветра» для всех желающих. Там, на холме с видом на море, люди могли набрать номер и поговорить с теми, с кем уже не получится поговорить.

Тысячи людей посетили эту телефонную будку. Когда дело касается тех, кто покинул нас, достаточно просто поговорить с воспоминаниями.

Перевод статьи Thomas McMullan: Artificial Intelligence Will Keep Our Loved Ones Alive

Предыдущая статья5 лучших курсов по React Native для разработчиков мобильных приложений
Следующая статьяТоп 10 альтернатив Github для размещения Open Source проектов