Диалог с компьютером
Диалог с компьютером читать книгу онлайн
Книга посвящена проблеме общения человека с компьютером на естественном языке, одной из важнейших в современной кибернетике. От ее решения зависят успехи во многих областях науки и техники, в первую очередь в тех, которые связаны с управлением механизмами, в том числе и компьютерами.
Внимание! Книга может содержать контент только для совершеннолетних. Для несовершеннолетних чтение данного контента СТРОГО ЗАПРЕЩЕНО! Если в книге присутствует наличие пропаганды ЛГБТ и другого, запрещенного контента - просьба написать на почту [email protected] для удаления материала
Основную роль в создании фоносемантического рисунка стихотворения играет частота звуков (точнее, звукобукв) в данном тексте. Поэт подсознательно нагнетает в стихотворении те звуки, содержательность которых ему нужна, он усиливает, обогащает фоносемантикой образы, впечатления и чувства, выраженные основной семантикой текста. И напротив, он избегает звуков с неподходящей в данном случае содержательностью, снижает их частоту.
Несколько неожиданным оказалось то, что ударные звуки в новой системе расчетов не играют особенно существенной роли: увеличение их веса мало что прибавляет к полученным результатам. Пожалуй, это объяснимо — звуков стало больше, и ударные «потерялись» в общей сумме, да и основной фоносемантический рисунок стиха ведут согласные, а не гласные. Видимо, ударение особенно важно для выстраивания ритма, а не фоносемантики.
Против ожидания не понадобилось как-то выделять и звуки рифм. Во-первых, трудно решить, какие звуки в рифмах следует подчеркивать. Ведь не всегда же бывает, как в стихотворении Д. Минаева «В Финляндии»:
Ну, если «розы — морозы» или «бежать — лежать», то тут тоже все ясно. Но как быть, когда как у В. Маяковского:
А сейчас в ходу вообще весьма вольная рифма, где возникает не точное эхо, а лишь некий отзвук. Например, у А. Вознесенского:
Во-вторых, только представьте себе, как осложнится ввод текста в компьютер, сколько будет мороки. А выигрыш все равно невелик. Нет, пусть лучше какие-то несущественные нюансы фоносемантики будут потеряны, зато ввод текста сохранится в самом обычном печатном виде. Даже в более привычном, чем ввод слов: там нужно было ударение указывать, а здесь просто печатный текст. Когда у компьютеров будут хорошо работать читающие устройства, с которыми сейчас много экспериментируют, то вообще ничего не нужно будет вводить, компьютер сам прочитает любой печатный материал.
Анализируется текст по-прежнему в звукобуквенной форме, то есть компьютер сам определяет мягкость и твердость согласных, а в остальном ориентируется на буквы.
Как-то под влиянием критиков, считавших почему-то, что для стихов важно только звучание, а написание вообще ни при чем, мы затранскрибировали несколько стихотворений (то есть записали их не буквами, а значками, изображающими звучание), затем закодировали транскрипцию цифрами (ведь знаков фонетической транскрипции нет на клавиатуре компьютеров), переделали программу под новый ввод информации, переделали таблицы оценок и частот звуков и после стольких мучений просчитали тексты «по звучанию». Но наши труды и муки оказались напрасными — результаты практически не изменились. Единственное утешение: «нулевой» результат в данном случае можно рассматривать как доказательство того, что для стихотворения важно как звучание, так и написание.
Общая схема разработанной системы автоматического анализа фоносемантики текста сводится в основном к следующему.
В памяти компьютера имеются таблицы оценок звукобукв по 15 признакам лексикона и нормальных частотностей (частостей, вероятностей) звукобукв в обычной разговорной речи. Обе таблицы несколько отличаются от тех, которые использовались в работе со словами. Таблица оценок выполнена так, что в ней указаны не сами средние оценки звукобукв по шкалам, а отклонения оценок от центра шкал (от 3,0) в положительную (левую) и отрицательную (правую) стороны шкал. В таблице нормальных частотностей не выделяются ударные гласные.
Компьютер определяет мягкость согласных и вычисляет частотности всех звукобукв в данном тексте. Затем полученные частотности сравниваются с нормальными. Все существенные (статически значимые) отклонения частотностей от нормы фиксируются, и дальнейшая работа идет только с ними.
Это очень важная операция, поэтому она требует пояснений.
Фоносемантический рисунок текста создается именно теми звуками, частотность которых резко отклоняется от нормы. Пока звук встречается в тексте стихотворения не чаще, чем обычно, он не останавливает на себе внимания. Но резкое превышение частотности подчеркивает данный звук, делает его заметным, выделенным. Его фоносемантика как бы вспыхивает и окрашивает собой звуковую содержательность текста. Если же звук необычно редко попадается в анализируемом тексте, его содержательность гаснет, и тем самым еще более высвечивается фоносемантика высокочастотных звуков.
Следующую, самую важную операцию можно назвать семантизацией отклонений. Здесь происходит вот что. Для звуков, отобранных по статистически значимым отклонениям частотностей от нормы, выбираются из таблицы оценки фоносемантики. Но как мы помним, эти оценки представлены в виде их отклонений от центра шкал. Если теперь сопоставить отклонения звуков по частотности от нормы и отклонения их же оценок от центра шкал, то возможны следующие ситуации. Допустим, что звук встречается в тексте стихотворения гораздо чаще, чем ему «положено» по норме. Значит, это отклонение со знаком « + ». Допустим далее, что и по какой-то шкале (скажем, «светлый — темный») оценка этого звука тоже отклоняется в положительную («светлую») сторону. Значит, в тексте нагнетается этот «светлый» звук, и путем перемножения отклонений компьютер соединяет оценку с частотностью, как бы набирая очки за «светлое» звучание текста (плюс на плюс дает плюс). Если в то же время какой-то «темный» звук (отрицательная оценка) по частотности отклоняется в отрицательную сторону, то есть встречается гораздо реже, чем «положено», то это еще более «высветляет» общую фоносемантическую картину, так как перемножение двух отрицательных величин тоже дает плюс. Но если звук «светлый» (положительное отклонение), а встречается меньше нормы (отрицательное отклонение), значит, данный звук «сыграл» против «светлой» фоносемантики (плюс на минус дает минус).
Так, подсчитывая очки за «светлое» звучание и против него, компьютер и обнаруживает ведущую тенденцию. Скажем, в тексте большинство «светлых» звуков встречается больше нормы, а большинство «темных» — меньше нормы. В результате очков за «светлое» звучание будет больше, и компьютер выдаст в качестве характеристики фоносемантики текста признак «светлый». Анализ идет по всем признакам лексикона, и в конце концов компьютер выдает набор признаков, характеризующих общий фоносемантический тон всего произведения.
Схема анализа есть. Но нужно еще убедиться в том, что она выявляет действительно фоносемантический, а не какой-нибудь другой аспект общего смысла текста. Возникает задача, сходная с той, которая уже решалась в предыдущей главе для отдельных слов. Там мы придумали разные слова-манекены, лишенные всех аспектов значения, кроме фоносемантического. Хорошо бы и здесь поступить так же. Да только как придумать «стихотворения-манекены» ?