Семь раз проверь... Опыт путеводителя по опечаткам и ошибкам в тексте
Семь раз проверь... Опыт путеводителя по опечаткам и ошибкам в тексте читать книгу онлайн
Автор настоящей книги знакомит читателя с испытанными средствами и приемами, которые целесообразно использовать в борьбе за точность печатного слова, предупреждает о тех «опасных перекрестках», на которых чаще всего возникают ошибки и опечатки, говорит о типичных ошибках — грамматических, логических, технических, — которые засоряют печатные издания.
Приведенные в книге сведения будут полезны и интересны как непосредственным участникам создания книги — авторам, редакторам, корректорам и т. д., так и самому широкому кругу читателей.
Внимание! Книга может содержать контент только для совершеннолетних. Для несовершеннолетних чтение данного контента СТРОГО ЗАПРЕЩЕНО! Если в книге присутствует наличие пропаганды ЛГБТ и другого, запрещенного контента - просьба написать на почту [email protected] для удаления материала
Возможно, что приведенный пример несколько сложен для непрофессионала. Зачем, в самом деле, автору или редактору углубляться в тонкости полиграфической техники? Наша цель — быстрее находить и исправлять ошибки в печатном слове, а заботиться о том, чтобы меньше ошибались и человек, и машина, должны те, кому это положено по должности. Но, поскольку мы начали с утверждения, что в опечатках есть своя логика, последовательность, как в безумии Гамлета, по словам Полония, была своя система, для нас известный интерес представляют и производственные операции, нечеткое выполнение которых закономерно влечет за собой и «словесный брак».
Энтузиаст научной организации труда поэт А.К. Гастев когда-то провозгласил: «Самый способ словесного и письменного выражения должен быть приправлен точной мерой» [ 30, с. 94]. В то же время знаменитый математик, как ни странно, предостерегал против увлечения цифрами: «Если можно советоваться с цифрами, то никогда не следует быть их рабом» [ 16, с. 160]. Запомним эти слова, так как к ним еще придется вернуться!
Действительно, не соблазнительно ли приправить количественной мерой то, что мы хотим знать об ошибках и опечатках? «Для того чтобы найти новый технический способ использования вещей, — читаем в книге о путях исследования мышления, — часто надо бывает прежде всего „открыть“ (в буквальном смысле слова) эти как бы закрытые вначале для восприятия свойства данных вещей, увидеть их с другой стороны» [ 99, с. 112].
Воспользуемся для иллюстрации рассказом Конан Дойля «Пляшущие человечки». По ходу действия знаменитый сыщик Шерлок Холмс разгадывает секрет пляшущих фигурок, показавшихся недогадливому доктору Ватсону детской забавой. Среди пятнадцати фигурок первого послания Шерлок Холмс заметил четыре одинаковые и предположил, что они означают букву «Е», которая встречается в текстах чаще, чем любая другая буква английского алфавита. Из его рассуждений явствует, что вслед за «Е» в английском тексте по частоте встречаемости идут буквы «Т», «А», «О», «I», «N», «S», «Н», «R» и т.д. Зная порядок их возможного появления, знаменитый сыщик постепенно находит недостающие буквы и восстанавливает весь текст.
Поразительно, что Шерлок Холмс, располагая лишь карандашом и бумагой, чисто эмпирическим путем пришел к результатам, которые полвека спустя были получены с помощью мощной электронно-вычислительной техники: по современным данным, буква «N» в английском алфавите идет по частоте встречаемости за буквой «О», а далее — буквы «R», «I», «S», «Н» и другие [ 48, с.79].
После небольшого экскурса в классический детектив мы можем, не рискуя озадачить читателей, поставить несколько странный вопрос: какая буква самая нужная? Напрашивается ответ, что нужны-то собственно все буквы алфавита. Но будь они все одинаково употребительными, Шерлок Холмс не смог бы разгадать хитрую тайнопись, придуманную отцом несчастной Илcи Каббит.
Методика, которую применил герой Конан Дойля для реконструкции зашифрованного текста, практически важна в производстве печатного слова. Очевидно, что с точки зрения наборщика самые нужные буквы — это те, которые больше всего у него в ходу.
Рациональным образом это отражено в устройстве старой наборной кассы для русского шрифта, до сих пор используемой в ряде типографий: среди девяноста пяти гнезд для строчных и прописных букв мы видим «помещения» побольше и поменьше. Размеры ячеек наборной кассы определяются прежде всего тем, насколько часто в процессе набора требуется та или другая буква. Изобретатели кассы для ручного набора прикинули эту потребность на глаз, а вот конструкторы линотипа учли, что в русском тексте доминирует буква «о». В магазине строкоотливной машины имеются девяносто два канала для размещения линотипных матриц — почти столько же, сколько ячеек в наборной кассе. Девяносто каналов соответствуют буквам на клавиатуре, но для матриц буквы «о» предназначен дополнительный канал, так как в противном случае происходили бы задержки из-за недостачи столь популярной буквы и машина работала бы с перебоями.
И все же буквы распределены по гнездам наборной кассы грубо и приблизительно, так как соотношение их численности не всегда совпадает с настоящим положением вещей. «Не только отдельные виды литературы, — писал Н.Н. Проскурнин в статье «Подсчеты частоты литер и комплектовка шрифта», — но даже стиль отдельных авторов требуют другого соотношения литер, чем то, которое предусматривает стандартная комплектовка, не говоря уже о таких чисто случайных моментах, когда, например, собственные имена, встречающиеся в каком-либо романе, очень часто повторяются, что требует, прежде всего, большого количества определенных прописных букв» [ 90, с. 76].
Сборник «Письменность и революция», в котором появилась указанная статья, вышел более сорока лет назад, задолго до изобретения быстродействующих электронно-вычислительных машин, которые могли бы произвести более точные подсчеты. Но весьма характерно, что к тем же, примерно, выводам приходят и математики, пользующиеся современной вычислительной техникой.
Так, авторы книги «Вероятность и информация» А. М. и И.М. Ягломы, касаясь вопроса о вероятности появления различных букв в русском тексте, пишут: «Строго говоря, эти частоты могут несколько зависеть от характера текста (например, в учебнике по высшей математике частота обычно очень редкой буквы „ф“ будет заметно выше средней из-за частого повторения слов „функция“, „дифференциал“, „коэффициент“ и некоторых других; еще больше отклонения от нормы в частоте употребления отдельных букв можно наблюдать в некоторых художественных произведениях, особенно в стихах)... Как правило, однако, подобные отклонения будут все же сравнительно небольшими и в первом приближении ими можно пренебречь» [ 139, с. 237–238]. По мнению математиков, любой отрывок напечатанного текста по своим статистическим закономерностям приближается к «среднему языку» [ 138, с. 100].
Проанализировав разнообразные тексты, взятые из самых различных источников (стихи, проза, научная литература и пр.), математики не просто на глазок, а с помощью точных средств и методов определили, насколько же «нужна» каждая буква в отдельности.
Вглядитесь в приведенный ниже ряд букв:
о е а и т н с р в л к м д п у я ы з ь ъ б г ч й х ж ю ш ц щ э ф
Здесь перед нами тридцать две буквы русского алфавита. Но впечатление такое, словно все они взбунтовались и сорвались со своих привычных мест. Ничего подобного! Буквы стоят в безусловном порядке, но не в той последовательности, в какой мы привыкли их видеть в букварях и словарях. Наиболее «нужные» выдвинуты вперед, а те, которые реже встречаются в печати, потеснились на задние места. Этот порядок обусловлен относительной частотой появления в тексте каждой отдельной буквы. Например, для буквы «о» относительная частота составляет (в условном исчислении) 0,090, а для буквы «ф» — 0,002, то есть первая буква встречается в тексте в сорок пять раз чаще, чем последняя. Одинаково часто встречаются пары букв «а» и «и» (у них одинаковые значения частот), «т» и «н», «ы» и «з», «ь» и «б», «ю» и «ш», «щ» и «э», но букву «р» мы найдем в печати в четыре раза чаще, чем «й», а букву «ж» в пять раз реже, чем «л», и т.д.
Дальнейшие подсчеты показали, что четыре самые «нужные» буквы — «о», «е», «а», «и» — составляют около одной трети (33,9%) русского печатного текста. Следующую треть (33,6%) образуют шесть букв — «н», «т», «р», «в», «с», «д». И лишь последняя треть (32,5%) приходится на долю всех остальных двадцати двух букв.