Репортаж с ничейной земли. Рассказы об информации
Репортаж с ничейной земли. Рассказы об информации читать книгу онлайн
Как измерить количество новостей, принятых по телеграфу? В каком виде передаются «записи» о наследственных признаках? Как возникает в природе живая материя? Как рождается мысль?
Чтобы найти ответы на эти вопросы, читатель должен пройти вместе с автором и героями киигн по улицам условного Нового Города и по просторам Ничейной земли. Эта книга поможет ему понять, почему методы, рожденные техникой связи, нашли применение в биологии и психологии и как удалось измерить одними и теми же единицами информацию в клетке, в кристалле н на страницах газет.
Обсуждаются также проблемы, которые еще предстоит решить современной науке с помощью теории информации.
Автор не обходит молчанием спорные вопросы. Читатель примет участие в горячих дискуссиях, познакомится с разными точками зрения и вооружится новыми знаниями, помогающими глубже понять окружающий нас материальный мир.
Внимание! Книга может содержать контент только для совершеннолетних. Для несовершеннолетних чтение данного контента СТРОГО ЗАПРЕЩЕНО! Если в книге присутствует наличие пропаганды ЛГБТ и другого, запрещенного контента - просьба написать на почту [email protected] для удаления материала
Я замечаю с досадой, что нарушаю правило, установленное мной же самим. Разве можно увлекаться новой задачей, пока не решена прежняя? Проблем возникает так много, что нужно проявить железную выдержку, чтобы не сбиться с пути. Сейчас на повестке дня вопрос об избыточности, и потому я усилием воли заставляю себя вновь сосредоточить внимание на бессмысленных текстах.
- Так как же все-таки оценить их избыточность? - спрашиваю я ученого.
- О, эю уяснить вовсе не трудно. Посмотрите на эти фразы. Пока мы считаем, что все буквы имеют равную вероятность, по формуле Шеннона получается, что каждая буква алфавита несет информацию ровно 5 бит. А если учесть вероятность и корреляцию осмысленных текстов, то окажется, что неопределенность появления каждой следующей буквы составляет всего 1 бит. Получается разница в 4 бита. Это и есть избыточность текста. Значит, избыточность - это не учтенный нами порядок.
- А почему его считают избытком?
- Это тоже нетрудно понять. В каналах связи все буквы заменяются числами. А числа переводятся на двоичный код. Поэтому буква я будет выглядеть, как 100 ООО.
- А почему именно так?
- Разве вы не знакомы с двоичным кодом?
- Я знаком, но мне бы хотелось, чтобы наша беседа была понятна читателям.
- Хорошо, постараюсь выражаться яснее.
Буква я последняя в нашем алфавите. Ее порядковый номер - 32. 32 - это 2б, что в двоичной системе счисления обозначается как 100 000. Но это не сто тысяч! Это именно число 32, но записано оно только двумя цифрами - 0 и 1, и чтобы передать букву я, приходится потратить 6 импульсов: единицу и пять нулей7.
Когда импульсы следуют друг за другом, каждый из них несет одно из двух сообщений: 0 или 1, «да» или «нет». Значит, каждый импульс дает информацию 1 бит. И каждая буква текста при -учете законов чередования дает около 1 бита. Отсюда возникает вопрос: нельзя ли создать такой код, в котором импульсов будет не больше, чем букв?
Сортировка словесного груза
С этим новым вопросом пришлось повозиться еще несколько дней. Им занимались все члены отряда. Мы обнаружили, что существует множество различных способов, позволяющих избавить сообщения от излишеств. Мы начали с самых простых. В одном из текстов нам встретилась фраза:
Чтобы добиться спортивных успехов, необходимо непрерывно совершенствоваться, учиться у ведущих мастеров спорта, трудиться над повышением собственного мастерства, систематически тренироваться и закаляться.
Раньше мы не нашли бы в подобной фразе ничего необычного. Но теперь мы во всем находим излишки и потому прежде всего обращаем внимание на то обстоятельство, что сочетание ться повторяется в этой фразе целых шесть раз.
Если заменить все ться одним условным значком, подобно тому как это делают в стенографии, то 6 таких значков заменят целых 24 буквы, а сообщение станет короче на 18 букв. Метод этот изучается теорией информации и называется «укрупнением сигнала».
А вот пример, который встречался нам раньше. Сообщение о том, что Ботвинник играет черными, содержит в себе всего 1 бит. Но фраза Ботвинник играет черными содержит 22 буквы - целых 110 бит. Следовательно, 109 бит - это чистый избыток!
Как избавиться от «лишнего груза»?
А очень просто. Надо пользоваться специальным кодом: 0 - Ботвинник играет черными; 1 - черными играет партнер. И избытка как не бывало: вся информация уместилась теперь в одном импульсе, потому что импульс дает как раз 1 бит.
Но понять смысл таких сообщений сможет не каждый. Надо заранее знать о том, что возможны лишь два различных исхода, и каждый имеет свою вероятность: P1 - вероятность того, что Ботвинник играет черными; P2 - вероятность того, что черными играет партнер. Зная заранее, что P2 = P1 = 50 процентам, мы посылаем сигналы 0 или 1, и они дают нам как раз то количество информации, которое мы ожидаем, - 1 бит.
Для того чтобы пользоваться этим условным кодом, мы должны предварительно получить информацию о том, что он будет обозначать. Нам должно быть известно заранее, что речь пойдет о шахматном матче, а не о принятии резолюции на Ассамблее ООН. Мы должны знать, что в матче участвуют, скажем, Таль и Ботвинник, а не кто-то другой. Но все эти сведения мы должны получить однажды, а дальнейшие сообщения, вроде: Ботвинник играет черными; черными играет Таль, уточняют лишь, кто из них будет играть черными в очередной встрече, то есть дают всего 1 бит. Поэтому с точки зрения теории информации нет никакого смысла на протяжении всего матча 24 раза подряд повторять подобные фразы - ведь можно значительно уменьшить избыточность, применив специальный код.
Кстати, именно так и поступают работники телеграфа при передаче поздравительных праздничных телеграмм. Почему эти телеграммы стоят дешевле обычных? Потому что в них то и дело повторяются фразы: Поздравляю с Новым годом; Желаю успехов, здоровья, счастья... А работники связи делают просто: вместо слов поздравлений и пожеланий посылают один условный значок. Но все же указанный способ имеет лишь частное применение: он пригоден в тех случаях, когда сообщения повторяются несколько раз. А нельзя ли найти более общие методы, избавляющие от излишеств любой передаваемый текст? Оказывается, такой способ уже нашли. Специальные устройства сортируют «словесные грузы». Грузы эти сортируются не по весу, не по качеству, не по объему, а по вероятности появления букв.
Чтобы передать текст по каналу связи, надо применить какой-нибудь код. Если бы нам предложили выбрать способ кодирования, мы, очевидно, поступили бы просто: поскольку все буквы для нас равноценны, мы выписали бы подряд весь алфавит и присвоили буквам порядковые номера. Затем условились бы, что каждому номеру соответствует какая-то высота импульса: чем больше порядковый номер буквы, тем больше соответствующий импульс.
Казалось бы, именно так и следует поступить. Но если оценить этот код с точки зрения избыточности сообщений, он окажется очень невыгодным. Почему? Потому что он был составлен без учета вероятности букв. Возьмем, например, букву т. В алфавите она занимает 20-е место. Значит, если а передается каким-то маленьким импульсом, то т будет передано импульсом, в 20 раз большим. Чем больше импульс, тем больше энергии расходуется при передаче. Буква т встречается в тексте почти так же часто, как а8.
Если бы мы обозначили букву т маленьким импульсом, то сэкономили бы много энергии. Чтобы уменьшить избыточность, надо применить такой код, чтобы буквам с самой большой вероятностью соответствовал самый маленький импульс.
Если известны заранее вероятности всех букв русского текста, электронная трубка может избавить нас от дальнейших хлопот. Можно поручить ей «сортировку» любого текста.
Так же как в любой телевизионной трубке электроны, излучаемые катодом, фокусируются в узкий пучок. Проходя через щель, образованную двумя пластинами, он падает на экран. Если на верхнюю пластину подать положительный импульс, луч отклонится вверх. Мы включили это устройство в канал передачи словесного текста, каждой букве которого соответствует импульс определенной величины.
Начинается передача. На верхнюю пластину трубки приходят импульсы. Луч прыгает по экрану, отклоняясь то больше, то меньше в зависимости от приходящих сигналов. Экран здесь необычный: на него нанесена тонкая пленка с неравномерной прозрачностью. Это и есть то самое «сито», которое должно произвести «сортировку» букв. Нанося эту пленку, мы учли существующий в тексте порядок. Если появилась буква, имеющая малую вероятность, луч попадает в прозрачную часть экрана. А буквам, которые в тексте встречаются часто, мы постарались создать самый плотный барьер. Чем меньше яркость луча, прошедшего сквозь «сито», тем меньше ток фотоэлемента, с помощью которого будет передан дальше этот сигнал. Значит, на выходе фотоэлемента мы получим тот код, который нам нужен: букве с самой большой вероятностью будет соответствовать самый маленький импульс.