-->

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро

На нашем литературном портале можно бесплатно читать книгу Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро, "TWDragon"-- . Жанр: Программирование. Онлайн библиотека дает возможность прочитать весь текст и даже без регистрации и СМС подтверждения на нашем литературном портале bazaknig.info.
Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро
Название: Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро
Автор: "TWDragon"
Дата добавления: 16 январь 2020
Количество просмотров: 251
Читать онлайн

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро читать книгу онлайн

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро - читать бесплатно онлайн , автор "TWDragon"

Эта мини инструкция в картинках, описывающая полный цикл создания электронной версии научно-технической книги, и предназначена для человека, искренне захотевшего сделать приемлемого качества е-книгу, но не знающего с чего начать.

Итак: перед вами взятая у приятеля, из библиотеки, или просто хорошая, интересная книга, которую хотелось бы иметь на компьютере. И не просто иметь, а иметь в таком виде, который позволил бы выполнять поиск по тексту, удобно читать книгу на экране монитора или на устройствах еВоок, а если это не научно-техническая или справочная литература – еще и читать на любимом сотовом телефоне, iPhon'e или PDA. В этом пошаговом руководстве, основанном на собственном опыте, я постараюсь рассказать о том, как «выжать» максимум результатов из проделанной простой, но иногда весьма утомительной работы по сканированию книги.

Пусть вас не испугает длина этого руководства и кажущаяся сложность сканирования и обработки книги. Процесс действительно довольно сложен и многоступенчат, но поверьте мне, описать все эти операции было гораздо труднее, чем выполнить их шаг за шагом.

 

Внимание! Книга может содержать контент только для совершеннолетних. Для несовершеннолетних чтение данного контента СТРОГО ЗАПРЕЩЕНО! Если в книге присутствует наличие пропаганды ЛГБТ и другого, запрещенного контента - просьба написать на почту [email protected] для удаления материала

1 2 3 4 5 6 7 8 9 10 11 ВПЕРЕД
Перейти на страницу:
Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро - pic_60.jpg

4. Создание текстового слоя

После того, как все уже сделано, остановится на этом просто себя не уважать, не говоря уж об остальных.

Для добавления распознанного текстового слоя в djvu книгу потребуется две программы. Первая это FineReader 7.0 или 8.0 версии. Вторая программа, это небольшая утилита DjvuOCR 2.1 от болгарского камрада Gencho.

Загружаем все, обработанные в кромсаторе, тифы в FineReader, те из которых была сделана djvu книжка, и распознаем в пакетном режиме. После распознавания, ничего не правим, не вычитываем, просто сохраняем пакет на диск, желательно путь для того пакета надо выбирать попроще, у DjvuOCR могут быть проблемы, если в названии пакета и/или пути будут кириллические символы. С FineReader все. Ура, ура, ура, появилась новая версия этой утилиты 2.2, в которой сняты эти ограничения. Теперь можно редактировать текст после распознавания в ФР, соблюдая некоторые ограничения:

а) при редактировании сохранять некоторые символы оригинального текста (например интервалы), т.е. не переписывать большие блоки;

б) желательно сохранять количество строк в параграфе (т.е. не стирать знаки конца строки).

Кстати, для наших целей вполне подойдет триальная версия FineReader, которую можно свободно скачать с официального сайта разработчика.

Запускаем DjvuOCR, жмем на кнопку Manual made OCR manager

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро - pic_61.jpg

Далее, тоже все просто:

FineReader Project directory – выбираем каталог с проектом.

Output OCR text file – это любой, пустой текстовой файл, помещенный в каталог с проектом.

Ставим галочку на Burn DJVU file и выбираем djvu книжку.

Нажимаем Process.

Ждем несколько минут. И всё.

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро - pic_62.jpg

Добавление обложки

В добавлении обложки, если не преследовать сверхзадач, никаких особых хитростей нет. Сканируем обложку в цвете в 200 дпи, чистим ее по вкусу, слегка размываем ее и кодируем в djvu профилем Photo(300). Полученный файл добавляем в книгу, например с помощью Document Express Editor.

З.Ы. Поступают жалобы, что таким образом сделанная обложка имеет размер меньший, чем страницы книги, что выглядит не эстетично, поэтому делайте обложку, как Вам больше нравится, сохраняя размер в пределах разумного. Говорят, есть метода от Minor а по созданию сверх компактных обложек в 600 дпи, если не лень, поищите.

Оглавление

Знаете ли Вы, что в Вашу книгу можно вставить оглавление? А между прочим, благодаря уважаемому Shea, это поразительно просто! Для этого воспользуемся утилитой DjVu Hyperlinks Editor.

Добавляем книгу, указываем, на каких страницах находится оглавление (нумерация с учетом обложки), выставляем смещение 1 (для компенсации обложки) и жмем Создать!

Конечно, без глюков пока не обходится, проверьте на всякий случай результат, вопиющие случаи можно и поправить в ручную (см. вставку оглавления ручным случаем чуть ниже).

Аналогично, с помощью этой программы, можно создать предметный указатель (Тип работы).

Подробнее, обо всех возможностях программы, можно почитать в сопроводительном файле.

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро - pic_63.jpg

В 5 и 6 версии Document Express Editor это же можно сделать мышкой. Жмем на кнопку – прямоугольная гиперссылка, обводим пункт меню, выскакивает окно диалога – свойство гиперссылки, в котором выбираем линк на номер страницы и затем соответственно сам этот номер. Ну и так далее, пока рука не отсохнет. Только делаем это в самый последний момент, после добавления обложки, вкладок и пр., иначе ссылки сдвинутся.

Создание электронных книг из сканов. DjVu или Pdf из бумажной книги легко и быстро - pic_64.jpg

7. Использованные программы и где их взять

IrfanView www.irfanview.com freeware

ScanKromsator http://www.djvu-soft.narod.ru/ freeware

Solo 3.1 http://www.djvu-soft.narod.ru/ freeware

Document Express Editor http://www.djvu-soft.narod.ru/?

Document Express Enterprise http://www.djvu-soft.narod.ru/?

ABBYY FineReader www.abbyy.com. trial

DjvuOCR 2.1 http://djvuocr.ucoz.ru/ freeware

DjVu Hyperlinks Editor http://www.djvu-soft.narod.ru/ freeware

Заключение

Несколько о ФайнРидере.

Если Вы собираетесь сделать научно-техническую книгу в формате djvu – не надо использовать ФР для сканирования и обработки сканов!

Примите это как данность, если Вы хотите получить качественный результат, несмотря на предлагаемые ФР удобства по типа всё-в-одном, попробуйте все же данную инструкцию.

Из основных недостатков:

– использование сжатия на основе jpeg, что, как минимум, приведет к раздуванию е-книги после кодирования;

– примитивно реализованный алгоритм выравнивания страницы;

– если Вы сканируете в 300 дпи в градациях серого, то вся обработка будет выполнена

– для этого разрешения, в то время как в кромсаторе, сначала идет ресемплинг до 600.

Помните, что все вышеизложенное, не есть истина в последней инстанции, просто здесь систематизирован подход, практически гарантирующий неплохой результат. Но никто не запрещает, как использовать другие методики (Фотошоп с плагинами, BookRestorer, Corel PHOTO-PAINT, RasterlD…), так и экспериментировать с кромсатором (но вначале, настаиваю, сделайте несколько разворотов строго по инструкции, что бы было с чем сравнивать). Путей получения хорошего скана книги много, главное на выходе иметь 600 дпи!

1 2 3 4 5 6 7 8 9 10 11 ВПЕРЕД
Перейти на страницу:
Комментариев (0)
название