Журнал «Компьютерра» № 15 от 17 апреля 2007 года
Журнал «Компьютерра» № 15 от 17 апреля 2007 года читать книгу онлайн
Внимание! Книга может содержать контент только для совершеннолетних. Для несовершеннолетних чтение данного контента СТРОГО ЗАПРЕЩЕНО! Если в книге присутствует наличие пропаганды ЛГБТ и другого, запрещенного контента - просьба написать на почту [email protected] для удаления материала
Тьюринг ожидал, что компьютер пройдет тест к 2000 году, так как будет обладать памятью в 1 млрд. бит (119,2 Мбайт) и в процессе пятиминутного испытания сможет обмануть треть судей. Как минимум со сроками он ошибся. Но попытки сдать тест не прекращаются. В частности, каждый год проводится конкурс Лебнера, в рамках которого испытывают наиболее совершенных чат-ботов. Первое и второе места в нем не выигрывались еще ни разу. В первом случае машине-собеседнику нужно убедительно доказать, что она ничем не хуже человека, беседуя с судьями в режиме реального времени по видеосвязи. Во втором — постараться сделать это хотя бы через текстовое общение. Так что денежными премиями в $2000 поощряют просто удачные разработки.
Несмотря на то что в этом соревновании каждый год участвует достаточно много участников, «фаворитов» всего два: Jabberwacky, который завоевал бронзу в 2005 году, и A.L.I.C.E., признававшаяся лучшей три раза — в 2000, 2001 и 2004 году. Название программы — аббревиатура, которая расшифровывается как Artificial Linguistic Internet Computer Entity (можно перевести как «искусственная лингвистическая компьютерная интернет-сущность»).
Ричард Веллес начал работу над программой в 1995 году, а ее совершенствованием (или хотя бы клонированием) многие программисты занимаются по сей день. A.L.I.C.E. была в некотором роде уникальной разработкой. И не только потому, что ее общение многие эксперты считают более всего напоминающим человеческое. Автор опубликовал спецификации AIML — подвида XML, который использовался при создании программы. Язык распространяется под лицензией GNU GPL. Это привлекло людей и позволило создать вокруг проекта целое сообщество программистов, написавших интерпретаторы AIML на всех популярных языках программирования. Наиболее популярен интерпретатор Program D на Java. В результате подавляющее большинство сегодняшних чат-ботов используют базы знаний, разработанные на AIML. При этом многие из них способны к самообучению.
Кстати, в Рунете узнать чат-бота с такими возможностями можно по нецензурным выражениям, которыми он перемежает речь. И по частоте ненормативной лексики у виртуального собеседника можно судить, как давно он общается с отечественной IM-аудиторией. Хотя это общая проблема. Интернет-пользователи охотно учат программы плохому. Так, Уэс Моудс, автор бота «Мимика», четыре года назад даже призвал пользователей отказаться от глупых и нецензурных высказываний.
Одной из самых «талантливых» самообучающихся программ считается бот 20Q.net, расположенный по соответствующему URL. За двадцать вопросов он, по данным разработчика, способен отгадать любое задуманное слово. Поддерживается беседа на 21 языке (причем различаются американский и британский английский), но русского, к сожалению, нет. База данных в ходе таких викторин пополнялась в течение четырнадцати лет, так что программа может похвастать достаточно широкой «эрудицией».
Тем временем ряд поклонников AIML даже вынашивает идею объединения ботов по всему Интернету. Если им удастся достичь поставленной цели, то программы-собеседники, прежде чем признаваться пользователю в своих скудных умственных способностях, не позволяющих интерпретировать реплику, будут обращаться к общей базе данных, непрерывно пополняемой всем «сообществом» ботов в ходе многочисленных диалогов. Поэтому Ричард Веллес всячески поощряет появление ботов-клонов A.L.I.C.E., полагая, что наиболее вероятный путь развития для таких разработок заключается в количественном росте программ.
Вторая жизнь бота
Программы-собеседники прочно обосновались не только в IM-сетях, но и виртуальной вселенной Second Life. Для создания ботов в этой игре даже разработан подвид языка AIML (Linden Scripting Language).
Одной из первых за применение ботов в бизнес-целях взялась компания NativeMinds, разработавшая софт для обмена сообщениями с пользователями на естественном языке Virtual Representative (vRep). Теперь этой компании уже нет. По-видимому, ее, как и многих других, подкосил инвестиционный кризис 2001 года. Но все ее разработки около трех лет назад были выкуплены Verity за $3,8 млн. и теперь развиваются под крылом этой корпорации. NativeMinds и ее первых ботов многие участники рынка доткомов помнят по сей день, так как продукция компании впервые продемонстрировала возможность использования программ общения с клиентами.
NativeMinds потратила немало усилий, доказывая потенциальным заказчикам, что чат-боты, интегрированные, например, в интернет-магазины, служат эффективным средством упрощения структуры порталов и упрощения доступа для неквалифицированных пользователей, одновременно уменьшая нагрузку на персонал (техподдержку и отдел по работе с клиентами). По данным NativeMinds, виртуальный менеджер имеет ряд неоспоримых преимуществ перед реальным, выдавая полный вежливый ответ на все вопросы 24 часа в сутки 7 дней в неделю. А кроме того, vRep успевал обработать вшестеро больше запросов, придерживался того же стиля общения, что и обратившийся к нему пользователь, и не требовал зарплаты.
В результате одна из самых популярных разработок компании — Neuroserver — была установлена на сайтах Coca-Cola, Oracle, Ford и ряда других именитых корпораций. На сайте NativeMinds имелся собственный виртуальный консультант — Николь, а также созданный в рекламных целях персонаж — тетя Этель, которая среди представителей е-бизнеса была известна не меньше, чем Eliza Вейзенбаума в академической американской тусовке. Вообще, большинство разработок в сфере коммерческих чат-ботов, которые сейчас пользуются относительным успехом, начались в 2000—2001 гг., а некоторые и раньше. Правда, если в то время программы-собеседницы старались интегрировать исключительно в веб-порталы, то сейчас не менее активно они используются для реализации маркетинговых кампаний в IM-сетях.
Шесть лет назад была запущена демо-версия SmarterChild, продукт тогда еще стартапа ActiveBuddy. Позже компания была переименована а Colloquis. Бот-агент в AIM мог поддержать разговор, рассказывая о последних новостях, финансовых сводках и результатах спортивных матчей, а также сообщая точное время и делая прогноз погоды с учетом местоположения собеседника. За год SmaterChild поговорил примерно с 8 млн. пользователей, причем солидная часть аудитории призналась боту в любви. Это был не первый опыт Colloquis в разработке чат-ботов, но на тот момент самый успешный. После того как руководство компании узнало, что SmarterChild превзошел по популярности агента, разработанного для продвижения фильма «Austin Powers in Goldmember» по заказу New Line Cinema, демо-версию убрали из IM-сети. Долгое время пообщаться с известным ботом можно было только на сайте smarterchild.com, но в конце концов «по многочисленным просьбам» программу вернули в AIM.
SmarterChild сделал большую рекламу как самой Colloquis, так и идее виртуальных ассистентов в целом, а спустя некоторое время в свободном доступе появилась среда разработки BuddyScript SDK, в которой была создана программа. Пакет позволяет любому желающему сделать своего пиар-бота. Это не аналог AIML. BuddyScript позволял научить бота не только «говорить», но и выполнять различные задачи — например, набирать телефонный номер или искать товар в складской базе данных. Пакет включает также библиотеки самых частых фрагментов кода, функцию тестирования готового агента и коллекцию готовых ботов. Программы-собеседники, написанные на BuddyScript, поддерживают IM-сети AIM, MSN Messenger и Yahoo Messenger, а также могут работать через электронную почту, WAP и SMS. Правда, AOL требует, чтобы при запуске бота в ее сеть с коммерческими целями ей платили деньги как за предоставление рекламной площадки. Другие корпорации до такого еще не додумались.