Фреймы для представления знаний
Фреймы для представления знаний читать книгу онлайн
В книге описывается новый подход к решению проблемы представления знаний в системах искусственного интеллекта. В основе его лежит система фреймов — особых структур данных для понятийного представления стереотипных ситуаций в рамках общего контекста знаний о мире. С этих позиций дается описание механизмов человеческого мышления, распознавания образов, восприятия зрительной м слуховой информации, а также проблемы лингвистики, обучения и методы решения задач. Автор книги — известный американский ученый, специалист по искусственному интеллекту.
Книга предназначена для широкого круга научных и инженерно-технических работников, интересующихся созданием искусственного интеллекта. Она может служить хорошим пособием для студентов, специализирующихся в этой области.
Внимание! Книга может содержать контент только для совершеннолетних. Для несовершеннолетних чтение данного контента СТРОГО ЗАПРЕЩЕНО! Если в книге присутствует наличие пропаганды ЛГБТ и другого, запрещенного контента - просьба написать на почту [email protected] для удаления материала
Каждым терминалом могут устанавливаться условия, которым должны удовлетворять его задания. Простые условия определяются маркерами, например, в виде требования, чтобы заданием терминала был какой-либо субъект, или предмет подходящих размеров, или указатель на субфрейм определенного типа. (Субфреймы, фреймы и суперфреймы - это иерархически упорядоченные элементы, образующие системы фреймов). Более сложными условиями задаются отношения между понятиями, включенными в различные терминальные вершины.
Группы семантически близких друг к другу фреймов объединены в систему фреймов. Результаты существенных действий представляются в виде трансформаций между фреймами системы. Это дает возможность моделировать такие понятия, как внимание и ценность информации, сделать более экономичными некоторые типы вычислений, а также показать эффективность использования фреймов в системах ИИ.
При зрительном восприятии образов системы фреймов используются следующим образом: различные фреймы соответствуют различным позициям наблюдателя, анализирующего одну и ту же сцену, а трансформации между ними отражают результаты перемещения наблюдателя из одного места в другое. Для систем других типов различия между фреймами могут соответствовать результатам выполнения каких-либо действий, определенным причинно-следственным связям между объектами внешнего мира или разным точкам зрения по одним и тем же вопросам. Одни н те же терминалы могут входить в состав нескольких фреймов системы - это один из центральных моментов теории, позволяющий согласовывать информацию, поступающую из различных источников.
Теория фреймов во многом выигрывает благодаря возможности использования в ней ожиданий и других видов предположений. Терминалы фрейма в обычном своем состоянии заполнены так называемыми "заданиями отсутствия" или заранее заготовленными значениями, т. е. сведениями о деталях (частностях), которые не обязательно должны присутствовать в какой-либо конкретной ситуации. Связь заданий отсутствия со своими терминалами не является жесткой и неизменной, поэтому они легко могут быть заменены другими сведениями, более подходящими к текущей ситуации. Задания отсутствия могут, таким образом, выполнять роль переменных, служить для аргументации с помощью примеров (что часто делает излишним применение логических кванторов), представлять информацию общего вида и описывать наиболее вероятные случаи, указывать на способы проведения полезных обобщений и т. д.
Системы фреймов связаны, в свою очередь, сетью поиска информации. Если предложенный фрейм нельзя приспособить к реальной ситуации, т. е. если не удается найти такие задания терминалов, которые удовлетворяют условиям соответствующих маркеров, сеть поиска информации позволяет выбрать более подходящий для данной ситуации фрейм. Подобные структуры дают возможность использовать в системах фреймов различные методы представления информации, что имеет особое значение для разработки механизмов понимания.
После выбора фрейма в процессе согласования терминалам присваиваются такие значения, которые удовлетворяют всем условиям соответствующих маркеров. Ход процесса согласования частично контролируется информацией, связанной с самим фреймом (включая указания на то, как реагировать на непредвиденные обстоятельства), и в значительной степени опытом решения аналогичных или близких по смыслу задач. Если согласование внешних данных с маркерами терминалов неудовлетворительное, то сведения, полученные на его основе, могут быть с успехом применены при выборе альтернативного фрейма.
Отметим, что схемы, предложенные в настоящей работе, несовершенны во многих отношениях. Во-первых, некоторые варианты представления информации обсуждаются безотносительно к тем процессам, в которых они должны использоваться. Иногда приводятся только лишь описания свойств, которыми следует снабдить те или иные структуры. Маркеры и задания терминалов рассматриваются так, будто известны их соединения и связи с более крупными структурными единицами, чего на самом деле пока нет.
Помимо этих технических недочетов читатель не найдет в настоящей работе углубленного анализа проблемы "понимания" и возможностей ее изучения на основе разрабатываемой теории. Автор не претендует на то, что предлагаемые им идеи достаточны для создания совершенной теории, но считает, что структуры, связывающие в единое целое системы фреймов, могут оказаться полезными при объяснении ряда явлений, характерных для естественного интеллекта.
1.1. Локальная и общая теории зрительного восприятия
"...существует большая разница между теми, кто рассматривает все с точки зрения единого центрального зрительного восприятия, являющегося более или менее связанной или четко выраженной системой, на основе которой люди понимают, мыслят и чувствуют, т. е. теми, кто руководствуется единым, универсальным и организующим принципом, и теми, кто ориентируется на многие аспекты явлений, часто не имеющие отношения друг к другу и даже противоречивые и, если связанные, то лишь некоторыми узлами де-факто психологического или физиологического характера, но не обусловленные какими-либо этическими или эстетическими принципами...".
Когда мы входим в комнату, нам кажется, что мы видим всю возникающую перед глазами картину с одного взгляда. В действительности же зрительное восприятие - это длительный процесс. На все требуется время: и на то, чтобы рассмотреть детали и собрать о них нужную информацию, и на то, чтобы, сделав предположения, проверить их и прийти к определенным заключениям, и на то, чтобы оценить полученные данные с учетом преследуемых целей, собственных знаний и ожиданий. Тем не менее, все это происходит настолько быстро и естественно, что невольно вызывает удивление и требует объяснений.
Некоторые специалисты считают неудовлетворительными те теории, в которых делается попытка трактовать феномен зрительного восприятия с позиции дискретных, последовательных, символьных процессов. Им кажется, что хотя машинные программы, написанные на основе этих теорий, действительно могут демонстрировать эффект "видения", для живых существ они неприемлемы ввиду грубости восприятия и малого быстродействия. Однако обычно предлагаемая альтернатива, относящаяся к крайнему случаю холизма или идеалистической "философии целостности" (см. В.Г.Афанасьев, 1964), не может быть технически реализована. Ниже я приведу доводы в пользу того, что следующие один за другим символьные процессы могут объяснить суть явлений, которые нам кажутся мгновенными и завершенными и которые имеют место при анализе сцен.
Часть теоретиков, придерживающихся ранних гештальт-психологических концепций (подробнее см. М.Г.Ярошевскнн, 1976), стремилась объяснить феномен зрительного восприятия с помощью имеющегося в человеческом мозге электрического поля, но уже в 30-х годах нашего столетия стала ясна несостоятельность подобных воззрений. Их современные последователи, включая приверженцев идеи интегральных преобразований, использования голограмм и интерферентных явлений, достигнуть многого также не сумели. И все же, несмотря на эти неудачи, большинство специалистов по-прежнему полагает, будто требуемая скорость восприятия может быть обеспечена только посредством некоторого глобального параллельного процесса, подобного волновому.
Излагаемая в настоящей работе теория фреймов рассматривает все основные вопросы, поднятые гештальт-психологами. Общим для обоих подходов является стремление раскрыть суть процессов, лежащих в основе соотнесения сенсорных данных либо с общими понятиями, либо с их частями, но методы, предложенные для обоснования выдвинутых положений, в корне отличны друг от друга. Гештальт-психологи стремились доказать, что эти процессы основаны главным образом на взаимодействии небольшого числа универсальных и весьма эффективных процедур, но неудачи с их эффективным выделением показали ограниченность этой идеи. В теории фреймов упор делается на многочисленность взаимодействий между сенсорными данными и образованной в процессе обучения громадной сетью символьной информации. И хотя эти взаимодействия должны, в конечном счете, основываться на том или ином наборе общих принципов, в нашей теории изучение мыслительных процессов отделено от вопросов происхождения и развития систем ИИ.