Форум Химиков - Энтузиастов. Химия и Химики
http://chemistry-chemists.com/forum/

Как сканировать книги?
http://chemistry-chemists.com/forum/viewtopic.php?f=15&t=5003
Page 4 of 4

Author:  Volodymyr [ 28 Jul 2014 19:17 ]
Post subject:  Re: Как сканировать книги?

Штатив желателен в любом случае, но в библиотеке это проблематично.

Насчет размера экрана - можно увеличить изображение на мониторчике: если текст смазан - по увеличенному фрагменту это будет хорошо видно.

Author:  radical [ 15 Jan 2016 22:17 ]
Post subject:  Re: Как сканировать книги?

А кто работал с программой ScanTailor? Можно как-нибудь ее настроить, чтобы она чуть быстрее работала, а то так долго открываются страницы при просмотре.

Author:  antabu [ 16 Jan 2016 08:11 ]
Post subject:  Re: Как сканировать книги?

Действительно, медленно работает, особенно с цветными изображениями высокого разрешения. У меня версия 0.9.11. Впечатление, что чут быстрее открываются изображения, если их исходный формат .tif со сжатием packbits. Параллельно можно просматривать в IrfanView.

Author:  radical [ 16 Jan 2016 12:32 ]
Post subject:  Re: Как сканировать книги?

Я сканировал в разрешении 600dpi, оттенки серого. Одна страница в tiff получается около 100MB. Книга еще большого формата, целиком разворот в сканер не помещается, сканировал постранично, каждая вторая страница перевернута. Потом в скантейлоре переворот, обрезка страницы, выравнивание. После того, как программа обработает все страницы на автомате, нужно еще просмотреть все страницы вручную, чтобы убедиться, что все корректно обработано. Иногда достаточно просто превью глянуть, оно листается с нормальной скоростью. А вот загрузка страниц для просмотра занимает секунд 5-10, это при том, что рабочую директорию я специально поместил на SSD. Особой нагрузки на процессор и память при этом не заметно.
Думаю, что дело в устаревшей программе, она старая и давно уже не обновлялась автором. А вот параллельно просматривать страницы в другом вьювере я не догадался, спасибо за идею.

Author:  Иван Николаевич [ 16 Jan 2016 13:03 ]
Post subject:  Re: Как сканировать книги?

Использую старую версию Scan Tailor Featured. Как то сравнивал ее с новой - в старой удобнее обработка картинок. Есть регулятор загрузки системы - ставлю на максимум. Вообще программа очень простая и удобная. Работает довольно быстро.
Все книги обрабатывал ей.
Если интересна схема:
Сканы (использую для сканирования портативную VueScan) в серых 300 или 400 dpi tiff, в зависимости от текста. Например, в недавно выложенных книгах Танасийчука -на 300 dpi. Можно сделать скан страницы так и так и - обработав сравнить. 600 dpi -излишне, слишком долго.

Обрабатываю Скан Тейлором, картинки выделяю (кроме черно-белых схем и стрелок), потом в конце экспорт на задние и передние субсканы, задние с текстом. DJVU Small обрабатываю в DJVU. Передние субсканы DjVu Imager обрабатываю и ей же вклеиваю в djvu. Потом отдельно сделанные Скан Тейлором обложки (иначе Скан Тейлор для страниц делает слишком большие поля, что неудобно для читалок) присоединяю DJVU Editor pro 5.
Очень удобная схема. В основном максимум времени тратится на сканирование, хотя настроив VueScan - нажимаешь одну кнопку мышью. Автоназвание сканов для DJVU Small лучше задавать типа 0000+. Иначе бывает неправильная сортировка.

Author:  antabu [ 17 Jan 2016 13:39 ]
Post subject:  Re: Как сканировать книги?

Просматривать в другом вьювере имеет смысл только после вывода страниц. До этого Scan Tailor не производит операций с изображением, только запоминает их во временных файлах.

Author:  radical [ 17 Jan 2016 14:14 ]
Post subject:  Re: Как сканировать книги?

Попробовал сейчас новую редакцию скантейлора, работает заметно быстрее.
Единственное, пропал почему-то пункт при редактировании "применить к каждой второй странице"
https://github.com/Tulon/scantailor/releases

Author:  antabu [ 31 Jan 2016 07:45 ]
Post subject:  Re: Как сканировать книги?

Исправление dpi у части страниц.

Попадаются .pdf, у которых пиксельное разрешение разных страниц различно (кстати, известные мне просмотрщики этот параметр не показывают, приходится открывать Файнридером). Результатом конвертирования такого файла становится .djvu, страницы которого имеют одинаковые dpi, но разный размер. Кроме того, DjVu Small проводит сборку некорректно, если исходные изображения имеют разное разрешение.
Чтобы привести готовый .djvu в нормальный вид, нам понадобятся:
1. Консольная утилита djvudpi http://djvu-soft.narod.ru/soft/djvudpi.rar
2. В качестве интерфейса к ней для пакетной обработки файлов Total Commander с плагином executor http://wincmd.ru/plugring/executor.html
3. Комплект DjVuLibre + DjView http://sourceforge.net/projects/djvu/fi ... e_Windows/
Устанавливаем DjVuLibre и плагин. В настройках коммандера Плагины - Архиваторные - Настройка - Файлы с расширением djvu - Открывать с помощью \totalcmd\plugins\wcx\executor\executor.wcx. Затем в файле настроек плагина executor.ini следует прописать команду:
Code:
[djvu]
fileout1="[N].djvu"
command1=e:\Convertation\djvudpi\djvudpi.exe "filein" 600 "fileout"

,где "e:\Convertation\djvudpi\djvudpi.exe" - путь к утилите. Это на моём компе такой путь, а Вы прописываете свой. Пути должны быть короткими, т.к. плагин имеет ограничение на длину команды.
600 - моё значение dpi выходных файлов. Рассчитывают так, чтобы размер изменяемых страниц и шрифтов на них стал таким же, как и у неизменяемых.
Итак, приступаем: исходный файл открываем в DjView и сохраняем как Непрямой документ DjVu (страницы в отдельных файлах). В Коммандере выделяем те страницы, у которых следует изменить разрешение. Можно переместить эти файлы в другую папку, мне, например так удобнее. Когда подлежащие изменению файлы выделены, нажимают на тулбаре Коммандера кнопку Распаковать файлы. После преобразования страницы с исправленным разрешением перебрасывают обратно в исходную папку. В этой папке файл с исходным именем снова следует открыть при помощи DjView и сохранить теперь уже как Связанный документ DjVu (в одном файле), это и будет исправленный документ.
Все операции проходят быстро, дольше идёт подготовка, размер файла не меняется. Проверено под Win XP.

Хотел было опубликовать этот материал для обсуждения на специализированном форуме, да видно, не судьба.

Page 4 of 4 All times are UTC [ DST ]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/