Фреймы для представления знаний
Фреймы для представления знаний читать книгу онлайн
В книге описывается новый подход к решению проблемы представления знаний в системах искусственного интеллекта. В основе его лежит система фреймов — особых структур данных для понятийного представления стереотипных ситуаций в рамках общего контекста знаний о мире. С этих позиций дается описание механизмов человеческого мышления, распознавания образов, восприятия зрительной м слуховой информации, а также проблемы лингвистики, обучения и методы решения задач. Автор книги — известный американский ученый, специалист по искусственному интеллекту.
Книга предназначена для широкого круга научных и инженерно-технических работников, интересующихся созданием искусственного интеллекта. Она может служить хорошим пособием для студентов, специализирующихся в этой области.
Внимание! Книга может содержать контент только для совершеннолетних. Для несовершеннолетних чтение данного контента СТРОГО ЗАПРЕЩЕНО! Если в книге присутствует наличие пропаганды ЛГБТ и другого, запрещенного контента - просьба написать на почту [email protected] для удаления материала
Глава вторая.
Язык, понимание и сценарии
2.1. Слова. предложения и смысл
"Механизм восприятия образов обладает некоторыми недостатками, которые являются платой за его исключительно ценные качества. Два из них, видимо, наиболее важны: образ, в особенности зрительный, склонен к обособлению ситуаций, более чем это биологически целесообразно; а принципы, лежащие в основе композиционного объединения образов, приводят к таким построениям, которые являются относительно беспорядочными, случайными и нерегулярными по сравнению с развертыванием привычных действий или довольно упорядоченным развитием мысли".
Концепция фрейма и использование заданий отсутствия, по-видимому, полезны при рассмотрении проблемы понимания смысла. Н.Хомский(1957) указывал, что такое предложение, как:
(A) Бесцветные зеленые идеи спят неистово трактуется совсем иначе, чем высказывание:
(B) Неистово спят идеи, зеленые, бесцветные.
Это происходит, во-первых, потому, что оба высказывания "одинаково бессмысленны", и, во-вторых, потому что процессы, связанные с анализом предложений, должны во многом отличаться от процессов, связанных с пониманием смысла.
Нет сомнения в существовании особых механизмов связанных с грамматическим разбором предложений. Поскольку смысл высказывания в равной мере "закодирован" как в позиционных и структурных отношениях между словами, так и в выборе самих слов, то должны существовать и механизмы, связанные с анализом этих отношений и участвующие в формировании структур, которые призваны более четко представлять смысл этого высказывания. Почему при выработке такой структуры слова в высказывании (А) производят большее впечатление и смысл их более понятен, чем в высказывании (В), если не касаться вопроса о том, следует ли называть эту структуру семантической или синтаксической? Потому что порядок слов в (А) и отношения между ними заданы с учетом (грамматических) условностей и правил, которыми люди обычно пользуются, чтобы побудить других конкретизировать определенными значениями задания терминалов своих понятийных структур. Это полностью согласуется с грамматическими теориями. Порождающая грамматика могла бы служить в качестве совокупного описания внешнего проявления этих правил (или связанных с ними процессов), а операции в трансформационных грамматиках достаточно близки к нашим трансформациям фреймов.
Следует, однако, уточнить, насколько самостоятельно используется грамматика при работе человеческой мысли. Вероятно, неприятие высказываний (вследствие конструкций, не соответствующих правилам грамматики, или просто непонятных) указывает на более сложный характер причин, обусловливающих семантический отказ выработать какое-либо представление. Ниже приводятся доводы в пользу того, что противопоставление грамматики и смысла может осветить две крайности из этого круга вопросов, но в то же время завуалировать все остальные его важные проблемы.
Мы, конечно же, не можем считать, что любой "логической" бессмысленности неизбежно сопутствует и бессмысленность психологическая. В самом деле, высказывание (А) можт породить определенный психический образ! Центральным в этом образе, как я понимаю, является фрейм сна, для которого система задает определенную кровать с "лежащим" на ней фреймом, представляющим мягкую, бесформенную полупрозрачную массу зеленого цвета. Во фрейме сна имеется терминал для задания характера сна (сейчас, видимо, беспокойного), а слово "неистово" кажется здесь несколько неподходящим, так как этот фрейм предпочитает не признавать в своем действии чего-либо намеренно спланированного или заранее предусмотренного. Еще больше смущает слово "идеи", поскольку в качестве субъекта мыслится какое-нибудь лицо или, по крайней мере, что-то живое. В рамках рассматриваемой структуры фрейма разрешить эти противоречия не удается.
Сказать что-либо подобное о высказывании (В) попросту нельзя, поскольку в нем нет ни одного существенного фрагмента, который можно было бы сопоставить с одним из возможных субфреймов.
Поэтому ни один более высокий по иерархии фрейм не получит каких-либо данных для согласования своих терминалов и, следовательно, ни один из фреймов верхнего уровня типа "смысл" или типа "предложение" не в состоянии сообщить о том, имеет ли высказывание (В) правильную грамматическую форму к (или) заложен ли в нем какой-нибудь смысл. Я полагаю, что сочетание этой "гибкой" теории с градацией отбора данных для заполнения заданий отсутствия может быть положено в основу разработки такой системы, которая скорее будет несостоятельной для предложений с "плохой" грамматикой, нежели для предложений, где ее попросту нет. Если более мелкие фрагменты, т.е. фразы и части предложений достаточно хорошо удовлетворяют субфреймам, то даже, несмотря на неполную согласованность данных на верхних уровнях могут быть построены образы, приемлемые для определенных видов понимания. Таким образом, мы получили качественную теорию грамматического разбора:
если данные удовлетворяют верхним уровням и не удовлетворяют некоторым терминалам более низких уровней, то на входе - бессмысленное предложение; если же картина обратная, то высказывание может иметь смысл, но оно облечено в грамматически неправильную форму.
Я не собираюсь утверждать, что восприятие предложений обязательно должно сопровождаться зрительными образами. Некоторые люди не пытаются представить себе цвет мяча в предложении "он ударил по мячу". Но, в конечном итоге, все согласятся, что в рамках вызванного из памяти сценария используются, если не такие характеристики, как цвет или размер, то цели, отношения и другие существенные элементы. Вне рамок зрительного восприятия терминалы и их задания отсутствия могут представлять цели и функции, а не только цвета, размеры и формы.
2.2. Рассуждение
Лингвистическая деятельность человека требует от него использования образований более крупных, чем те, которые могут быть описаны с помощью грамматических правил, а это в еще большей степени затрудняет понимание вопросов, связанных с разграничением синтаксиса и семантики. Рассмотрим следующую басню (У.Чейф, 1972):
"Жили-были волк и ягненок. Однажды увидел волк, что ягненок пьет воду из реки, и появилось у него желание съесть ягненка. Решил он найти себе хоть какое-то оправдание и, несмотря на то, что сам находился выше по течению, обвинил ягненка в том, что тот взбалтывает воду и не дает ему пить…"
Чтобы понять этот отрывок, надо ясно представить себе, что волк лжет! Чтобы понять ключевую фразу "несмотря на то, что...", надо знать, что жидкость не может двигаться вверх по течению, а это, в свою очередь, требует от нас понимания самих слов "вверх по течению". В рамках декларативной, основанной на исчислении предикатов логической системы фразу "выше по течению" можно задать в виде некоторой формулы, например:
[А находится выше по течению, чем В] / [Событие Т.B А поток мутный] => [Существует [Событие U.В В поток мутный]] / [U позже Т].
Однако более полное определение было бы гораздо сложнее. Например, как записать тот факт, что потоки воды, перемещая какие-либо предметы, обычно не изменяют их расположения относительно друг друга? Логик мог бы попытаться доказать его, исходя из достаточно сложной совокупности "локальных" аксиом и соответствующих правил индуктивного вывода. Представим эти знания с помощью особой структуры данных, которая автоматически переориентирует связи пространственных описаний с терминалов одного фрейма на терминалы другого в рамках одной и той же системы фреймов. И хотя это может рассматриваться как некоторый вид логики, здесь используются определенные механизмы такие же, как и для пространственного мышления.