На главную страницу сайта Опыты по химии Химический Юмор. Научный Юмор Опыты по физике    



Форум Химиков - Энтузиастов. Химия и Химики

Эксперименты по Химии - Практическая Химия - Книги по Химии - Физика – Астрономия – Биология – Научный Юмор
Прежде чем отправить свое сообщение - ознакомьтесь с ПРАВИЛАМИ ФОРУМА.
Прежде чем создать новую тему - воспользуйтесь ПОИСКОМ, возможно, аналогичная тема уже есть

All times are UTC [ DST ]




Post new topic Reply to topic  [ 68 posts ]  Go to page 1, 2, 3, 4  Next
Author Message
 Post subject: Как сканировать книги?
PostPosted: 24 Mar 2013 19:10 
Offline
.
User avatar

Joined: 04 Nov 2009 22:05
Posts: 63483
Location: Моя Батьківщина там, де моя лабораторія
Поскольку вопрос важен и его время от времени задают участники форума - решил создать отдельную тему.

Желательно сканировать книги на разрешении 600 dpi, если книга желтая - ставить "цветной 24 бита" (если нет - оттенки серого, но не черно-белый). При 300 dpi и ниже качество сильно падает.

Желательно, чтобы на компьютере был USB-2 или 3 - иначе время передачи данных от сканера очень растягивается.

Если сканер старый (медленный) - это значительно усложняет работу. Парочку небольших книг так отсканировать можно, но если вы планируете сканировать книги (и документы) хотя бы время от времени - стоит задуматься о новом сканере. Он себя окупит.
__________________________________________
Как правило, из отсканированных картинок потом создают djvu-файл. Я использую для этого бесплатную программу djvu-solo viewtopic.php?p=1047#p1047

1. Запускаем программу.
2. File - Open - (Опция jpg или другой формат картинки) - выбираем файл обложки.
3. File - Save as - (Вводим название) - В диалоговом окне: ставим точку напротив Scaned,
Resolusion для текста я ставлю 300 (чем меньше это число, тем больше файл) - жмем ОК
4. Файл обложки создан. Далее вставляем страницы:
Edit - Insert Pages After - (в диалоговом окне выбираем параметр jpg и опцию показать файлы таблицей);
выделяем все файлы, пользуясь кнопкой Shift и жмем ОК
5. Ждем, пока все картинки загрузятся (от нескольких секунд, до нескольких десятков минут), потом перемещаем вторую страницу в самый конец (где она должна быть)
и жмем File - Save
________________________________________________

Перед созданием djvu-файл страницы (картинки) можно обработать программой Scan Tailor - в случае аккуратной работы это значительно улучшит качество и уменьшит объем, но будьте внимательны - вы можете потерять часть текста и иллюстраций (например, если не так обрежете поле).

_________________
Думайте!


Top
 Profile E-mail  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 24 Mar 2013 20:19 
Offline
Участник
Участник

Joined: 09 Apr 2010 17:25
Posts: 639
Location: Моск. обл.
При самом сканировании книг удобно использовать программы, которые организуют этот процесс, например, Irfan View. Irfan View дает имена и нумерует файлы, позволяет преобразовать их оптом из одного формата в другой (напр., из jpg в tiff), позволяет сделать поворот скана, изменения яркости и контраста и пр.


Top
 Profile E-mail  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 25 Mar 2013 13:30 
Offline
Гуру
Гуру
User avatar

Joined: 15 Oct 2011 22:39
Posts: 6688
У меня на работе МФУ Canon, он сканирует через свою программу в PDF формат. Я не уверен, будет ли он работать со сторонними программами. Управление идет не с компьютера, а с МФУ, для сканирования страницы нужно нажать кнопки Scan и Color (для цветного режима) на МФУ. Разрешение тоже выбирается в меню МФУ.


Top
 Profile  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 25 Mar 2013 14:31 
Offline
Гуру
Гуру
User avatar

Joined: 03 Apr 2010 08:36
Posts: 2117
Location: Казань
Инструкция по изготовлению электронных книг (немного устаревшая, появились новые версии упомянутых программ):
Attachment:
ScanAndShare1.03.pdf [535.52 KiB]
Downloaded 961 times


Top
 Profile E-mail  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 25 Mar 2013 15:56 
Offline
.
User avatar

Joined: 04 Nov 2009 22:05
Posts: 63483
Location: Моя Батьківщина там, де моя лабораторія
radical wrote:
У меня на работе МФУ Canon, он сканирует через свою программу в PDF формат. Я не уверен, будет ли он работать со сторонними программами. Управление идет не с компьютера, а с МФУ, для сканирования страницы нужно нажать кнопки Scan и Color (для цветного режима) на МФУ. Разрешение тоже выбирается в меню МФУ.

В т.н. многофункциональных устройствах сканеры часто плохие: производитель на чем-то пытается экономить. Недостаток pdf в том, что страницы будут в виде картинок: суммарный размер файла будет примерно равен размеру картинок.

Главное, чтобы была возможность задать разрешение 600 dpi. pdf-файл можно потом сохранить как совокупность картинок и сделать из них djvu. Если же сканер будет выбирать параметры сканирования автоматически (разрешение, цвет и т.д.) - может получиться некачественно.

_________________
Думайте!


Top
 Profile E-mail  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 25 Mar 2013 16:20 
Offline
Гуру
Гуру
User avatar

Joined: 24 Nov 2009 12:17
Posts: 11322
Location: Новосибирск
Для сборки .djvu есть онлайновый сервис http://any2djvu.djvuzone.org/ , но ограничение на размер исходного архива и не хотят делать OCR кириллицы.

_________________
- Не люблю тех, которые вслух произносят один тост, а про себя думают другой.


Top
 Profile  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 25 Mar 2013 21:20 
Offline
Участник
Участник

Joined: 09 Apr 2010 17:25
Posts: 639
Location: Моск. обл.
Quote:
сканирует через свою программу в PDF формат

Возможно, что pdf задан по умолчанию. Это легко меняется в той же программе.
У нас на работе формат по умолчанию каждый настраивает для себя - то pdf, то tiff, то jpg.


Top
 Profile E-mail  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 25 Mar 2013 22:35 
Offline
Гуру
Гуру
User avatar

Joined: 15 Oct 2011 22:39
Posts: 6688
Спасибо за информацию, но вижу, что все равно нужно будет экспериментировать. Будет время, займусь.


Top
 Profile  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 27 Mar 2013 01:06 
Offline
Гуру
Гуру
User avatar

Joined: 02 Apr 2011 23:28
Posts: 1516
Location: Украина
У меня дома сканера нет, но есть на работе, правда для личных целей эксплуатировать его не разрешают; сканирование книг расценивают как нецелевое использование… Но иногда дорваться к сему чудесному устройству получается.
И вот я обратил внимание, что частенько при сканировании просвечивается текст с «изнанки», т.е. с другой страницы сквозь бумагу. И такое наложение довольно сильно портит качество сканированной страницы.
Устранить этот недостаток оказалось просто, нужно подкладывать под книжный лист при его сканировании совершенно черный предмет: лист черной бумаги/картона, кусок полиэтиленовой черной пленки, например вывернутый кулек от молока, крашенный в черный цвет тонкий пластик или лист металла; и т.п.
Суть эффекта — черное на черном не видать! Темные буквы с изнанки на фоне черной подложки сливаются и при грамотно выставленном балансе яркости-контрастности получается четкий текст на белом или сером (цветном) фоне, если бумага плохая.


Top
 Profile  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 27 Mar 2013 02:36 
Offline
Гуру
Гуру
User avatar

Joined: 13 Dec 2011 01:54
Posts: 4657
Location: Киевская обл.
У меня сканер есть, но последние пару лет я книги не сканирую, а фотографирую - раз в 5 быстрее получается. Для этого использую старый фотоувеличитель "Ленинград-2" (у него пантограф - идеальная для этого дела конструкция, позволяющая легко и быстро подстраивать резкость).
Attachment:
Ленинград-2_(фотоувеличитель)-2.jpg
Ленинград-2_(фотоувеличитель)-2.jpg [ 163.15 KiB | Viewed 27910 times ]

Подготовка агрегата простая: надо лишь открутить стопорный винт и вывернуть объектив, освободив таким образом отверстие для установки фотоаппарата. Фотик накладывается на верхнюю плоскость (вместо конденсорной линзы) и приклеивается скотчем так, чтобы можно было менять аккумулятор и жать на спуск. В общем, у меня уже всё отработано.
"Сканировать" идеально при рассеянном дневном свете. Сначала выставляется, скажем, левая часть разворота и шпарятся подряд все страницы (щёлкнул - перевернул, щёлкнул - перевернул...), затем книга передвигается влево и шпарятся страницы справа. Нюанс: левые страницы пакетно переименовываются в хххх-а, правые - в хххх-б. После этого можно скинуть их в одну папку - страницы книги выстроятся в верном порядке (естественно, для этого надо отщёлкать их поровну или, по крайней мере, с разницей не более чем в одну страницу; следить за нумерацией).
К примеру, крупную 600-страничную книгу я фотографировал около 2,5 часов. Это с заменой подсевших аккумуляторов, периодическим сливом на комп заполненной флэшки, гимнастикой затёкшей спины...


Top
 Profile E-mail  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 27 Mar 2013 03:38 
Offline
.
User avatar

Joined: 04 Nov 2009 22:05
Posts: 63483
Location: Моя Батьківщина там, де моя лабораторія
В свое время мой знакомый сфотографировал однотомник Брауэра (Препаративная неорганическая химия). Формат книги был А3 (обычный сканер рассчитан на А4). Штатива у него не было и были большие проблемы с освещением - так что качество вышло не очень. Но что есть - то есть. Сделал из этих файлов djvu и выложил. Файл получился большой.

Потом много лет этот файл путешествовал по сети. Нашлись даже желающие его "усовершенствовать": они снизили разрешения. В результате размер уменьшился, но часть текста стала нечитабельной.

Позже один киевлянин отсканировал книгу заново и прислал вместе с сотней других. Так что проблема решилась.

_________________
Думайте!


Top
 Profile E-mail  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 27 Mar 2013 15:22 
Offline
Гуру
Гуру
User avatar

Joined: 02 Apr 2011 23:28
Posts: 1516
Location: Украина
Vladimir wrote:
...
Желательно сканировать книги на разрешении 600 dpi, если книга желтая - ставить "цветной 24 бита" (если нет - оттенки серого, но не черно-белый). При 300 dpi и ниже качество сильно падает...

По-моему, 300dpi для большинства книг с нормальным шрифтом вполне достаточно, а 600 dpi — это многовато. При увеличении можно рассматривать волокна и укладку типографской краски. Зачем для чтения такая детализация? Размер файла и нагрузка на проц. растут существенно. Цвет тоже лишний, если нет цветного текста и/или цветных иллюстраций.
Мне приходилось некоторые книги пережимать, уменьшая разрешение и переводя страницы в градации серого. Толстые книги с чрезмерно лишними пикселями на слабом компе листать одно мучение.


Top
 Profile  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 27 Mar 2013 20:52 
Offline
.
User avatar

Joined: 04 Nov 2009 22:05
Posts: 63483
Location: Моя Батьківщина там, де моя лабораторія
Слабые компы - вид вымирающий, а халтурно отсканированная книга "апгрейду" не подлежит: она так и останется плохой и трудно читабельной (пока кто-то эту же книгу не отсканирует заново).

Если вы рассматриваете исходные картинки - это одно, а сделанный из них djvu-файл - совсем другое. Из картинок с низким разрешением невозможно создать нормальный djvu. Вернее можно, если вместо параметра "Сканированный текст" поставить "Изображения" - но тогда размер файла будет очень большим, практически как суммарный размер картинок (слабый комп при просмотре такого файла может вообще зависнуть).

Если дать 300 dpi и ниже - качество djvu может упасть настолько, что понадобиться дешифровальщик для того, чтобы разобрать текст - не говоря уже о иллюстрациях.

Зачем сканировать книгу без цветных иллюстраций в цвете? Да потому, что серый текст на желтом фоне вполне читабелен, а серый на сером - едва ли. Его еще можно разобрать в исходных jpg, но чтобы прочитать созданный из них djvu, вам придется постараться.

_________________
Думайте!


Top
 Profile E-mail  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 28 Mar 2013 09:58 
Offline
Гуру
Гуру
User avatar

Joined: 02 Apr 2011 23:28
Posts: 1516
Location: Украина
Забыли, что есть планшетники и электр. книги, у которых не шибко навороченное нутро. По мере удешевления этих устройств все более популярно будет (потому что гораздо удобней) читать DJVU-книги на них.

Давайте на конкретном примере высмотрим, как изменится качество текста при чтении с экрана, если ужать рекомендованный вами скан раза в два.
Для глумливого растерзания беру книгу:
Реакции твердых тел. Браун М., Доллимор Д., Галвей Л. 1983;
второй разворот с аннотацией. Итак,

• слева — пережатый мной целиком весь djvu, размер данной страницы 3234x2441, желтый фон оставил.

• справо — тоже самое, только серый фон;

• а серединка— это ваш оригинал, размер страницы 6469x4882, родной желтый фон;

Оба варианта книги в программе WinDjView выведены на полный экран (F11) и увеличены до 125% (жать Ctrl+M). Размер шрифта на экране видится одинаковым в обеих вариантах.
Далее я сделал скрины (Alt+PrtSc), сохранил их в файл, чтобы одним взглядом вы могли сравнить все варианты.

Attachment:
File comment: Представленная здесь картинка из BMP сохранена в JPEG-файл с параметром качества 100%, чтобы исключить явные артефакты сжатия.
.

Сравнение DJVU.jpg
Сравнение DJVU.jpg [ 1.85 MiB | Viewed 27757 times ]


И насколько критично снизилось качество? ;)

P.S.
Размер файла оригинала 23,2 МБ, пережатого мной 5,22 МБ. :ah:


Top
 Profile  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 28 Mar 2013 18:16 
Offline
.
User avatar

Joined: 04 Nov 2009 22:05
Posts: 63483
Location: Моя Батьківщина там, де моя лабораторія
Вообще-то для подобных экспериментов нужны исходные сканы, а не страницы, уже конвертированные программой. Советую выбрать старую книгу - с желтыми страницами и светло-серным текстом (например, Карякин 1947 года) и проблемами с доступностью текста возле переплета (кто сканировал книги - поймет).

Попробуйте отсканировать книгу сами: вместо того, чтобы вытягивать картинки из книг, отсканированных другими.
Иначе это выглядит, как попытка доказать свою правоту любой ценой (спор ради спора). Обычно так поступают люди, которые страдают от избытка свободного времени и недостатка желания.

______________________________________________________
1. Качество снизилось ощутимо. Если вы собираетесь читать всю книгу, а не только "пробную страницу" - ваши глаза почувствуют за счет чего была экономия в 18 Мб.
Хотите экономить место на диске и гробить зрение? Это ваш выбор, но других людей он ни к чему не обязывает.

2. Для подобных экспериментов рекомендую выбрать страницы с затенением на полях разворотов (в которое попадает текст): при снижении разрешения исходных сканов текст возле переплета просто исчезает (в вашем примере темная полоса изящно поглотит текст).

3. Одной страницы для обобщающих выводов мало: попробуйте отсканировать десяток-другой книг, тогда многие вопросы отпадут сами собой.

4. Если вас так беспокоит место на диске: обработайте книгу в Scan Tailor. Объем упадет, а качество улучшится.

P.S. Снизить разрешение и ужать картинки никогда не поздно: это минутное дело. Но если окажется, что вы отсканировали текст с плохим разрешением - работу придется делать заново.
Время же сканирования (даже для не очень хороших сканеров) слабо зависит от того стоит 300 или 600 dpi

_________________
Думайте!


Top
 Profile E-mail  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 29 Mar 2013 08:25 
Offline
Гуру
Гуру
User avatar

Joined: 02 Apr 2011 23:28
Posts: 1516
Location: Украина
Два предыдущих сообщения были для тех, кто сталкивался с тормозами при чтении некоторых книг на вполне конкретном устройстве, в моем случае — это планшетник. Читалки обычно не сообщают о причинах тормозов явным образом, доступным и понятным неискушенному пользователю.
Поэтому, я предложил вариант решения проблемы без существенной потери качества, на мой взгляд приемлемый для таких ситуаций.
Это не нужно делать правилом для всех. Каждому свое!

Vladimir wrote:
Попробуйте отсканировать книгу сами: вместо того, чтобы вытягивать картинки из книг, отсканированных другими.
Иначе это выглядит, как попытка доказать свою правоту любой ценой (спор ради спора). Обычно так поступают люди, которые страдают от избытка свободного времени и недостатка желания.

Главный администратор/модератор форума хочет перейти на личность? :bm:
Я написал в этой теме, потому что не нашел другой, более близкой, где обсуждались бы технические вопросы по работе со сканированными книгами.
Играть в перетягивание толстого каната в троллинге не буду. Со своей стороны дальнейшее обсуждение этой темы — нах. :aq:


Top
 Profile  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 29 Mar 2013 13:34 
Offline
Гуру
Гуру
User avatar

Joined: 24 Nov 2009 12:17
Posts: 11322
Location: Новосибирск
Между 300 и 600 dpi есть и компромиссные решения. Для достоверного распознавания текста большие значения предпочтительны, особенно это касается программ, альтернативных Файнридеру.

_________________
- Не люблю тех, которые вслух произносят один тост, а про себя думают другой.


Top
 Profile  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 30 Mar 2013 03:45 
Offline
Модератор
Модератор
User avatar

Joined: 17 Nov 2009 04:45
Posts: 12816
Location: г. Волгоград
Во время учебы в универе сканил лекции ставил как минимум 600-800 dpi и конвертировал в дежавю как фотографию. Потом текст можно было распечатать в хорошем качестве. Другие варианты не особо подходили для рукописного текста, да еще с полупрозрачными чернилами.

_________________
Accidit in puncto quod non speratur in anno


Top
 Profile E-mail  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 01 Apr 2013 14:32 
Offline
Гуру
Гуру
User avatar

Joined: 15 Oct 2011 22:39
Posts: 6688
Попробовал сегодня сосканировать разворот книжки с такими настройками, размер файла получился 100МБ :ai:
Что я делаю не так?


Attachments:
setting.JPG
setting.JPG [ 61.46 KiB | Viewed 27620 times ]
Top
 Profile  
 
 Post subject: Re: Как сканировать книги?
PostPosted: 01 Apr 2013 14:56 
Offline
.

Joined: 16 Aug 2010 17:38
Posts: 2048
antabu wrote:
Между 300 и 600 dpi есть и компромиссные решения. Для достоверного распознавания текста большие значения предпочтительны, особенно это касается программ, альтернативных Файнридеру.

Но есть нюанс - у ПЗС-линейки сканера конкретный шаг пикселей. И естественными являются разрешения кратные этому.
Конечно, драйвер сканера Вам программно наинтерполирует любое, но нужно понимать разницу между интерполированным изображением и изображением непосредственно сканированным в данном разрешении.
Опыт показывает, что TIFF 600dpi в градациях серого является наиболее пригодным для последующего распознавания. После распознавания конвертируется в однобитное изображение + распознанный текст. Т.е. эти огроммные тиффы нужны до этапа распознавания, дальше из можно убить. А однобитные 600dpi сканы, особенно, если их обработать для сглаживания краёв и удаления мусора, чрезвычайно компактны и очень причтночитаемы - на мелком тексте с 300dpi не сравнить.

_________________
Думайте! Это патриотично.


Top
 Profile  
 
Display posts from previous:  Sort by  
Post new topic Reply to topic  [ 68 posts ]  Go to page 1, 2, 3, 4  Next

All times are UTC [ DST ]


Who is online

Users browsing this forum: No registered users and 8 guests


You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot post attachments in this forum

Search for:
Jump to:  

[Сообщить об ошибке, испорченном вложении, битой ссылке]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group