Форум Химиков - Энтузиастов. Химия и Химики
http://chemistry-chemists.com/forum/

Как сканировать книги?
http://chemistry-chemists.com/forum/viewtopic.php?f=15&t=5003
Page 2 of 4

Author:  radical [ 01 Apr 2013 15:11 ]
Post subject:  Re: Как сканировать книги?

А вот в оттенках серого файл получается в три раза меньше. Хотел прикрепить образец, но прикинул, сколько он будет загружаться на моем ADSL 512K, и передумал. Бумага в книге желтая.
Кстати, какие вы используете вспомогательные программы для обрезки краев, поворота изображения и очистки его от мусора?

Author:  O'Bu [ 01 Apr 2013 15:22 ]
Post subject:  Re: Как сканировать книги?

radical wrote:
Попробовал сегодня сосканировать разворот книжки с такими настройками, размер файла получился 100МБ :ai:
Что я делаю не так?
Простой TIFF по объему - почти как BMP, и формат в принципе такой же - тупо записаны цвета пикселей, по 8/16/24 бита на каждый. В настройках должен быть TIFF with LZH compression или что-то вроде того.

Author:  Trel [ 01 Apr 2013 15:29 ]
Post subject:  Re: Как сканировать книги?

А почему нельзя сразу в jpeg сканировать? Качество практически не теряется, а размер уменьшается значительно. Да и например, на том же фотоаппарате, первоначальный формат другой (непомню как называется, но тоже вроде этого ТИФФ - не сжатый), а потом сжимается в jpeg.

Author:  stas [ 01 Apr 2013 15:44 ]
Post subject:  Re: Как сканировать книги?

Trel wrote:
А почему нельзя сразу в jpeg сканировать? Качество практически не теряется, а размер уменьшается значительно. Да и например, на том же фотоаппарате, первоначальный формат другой (непомню как называется, но тоже вроде этого ТИФФ - не сжатый), а потом сжимается в jpeg.

Почему нельзя? Даже на дешёвом китайском (вот как у меня) сканере можно выставить разрешение, тип файла и куда складировать. Настройки эти сохраняются.

Author:  Volodymyr [ 01 Apr 2013 17:14 ]
Post subject:  Re: Как сканировать книги?

С форматом TIFF работал мало (картинки TIFF получились после обработки исходных jpg программой Scan Tailor). Размер действительно огромный, но, по крайней мере, в моем случае в djvu они ужимались хорошо.

Author:  radical [ 01 Apr 2013 17:49 ]
Post subject:  Re: Как сканировать книги?

Попробовал сосканировать ту же страницу (разворот) в JPEG, получился цветной 9МБ, оттенки серого - 5.6МБ

Author:  Volodymyr [ 01 Apr 2013 19:00 ]
Post subject:  Re: Как сканировать книги?

У меня разворот А4 весит 3-5 Мб (jpg, 600 dpi, цветной с глубиной цвета 24 бита).

Попробуйте отсканировать несколько разворотов, а потом сделать из них djvu - вы сможете прикинуть, какой режим сканирования вам выбрать.

Author:  Oleg [ 02 Apr 2013 04:34 ]
Post subject:  Re: Как сканировать книги?

Trel wrote:
А почему нельзя сразу в jpeg сканировать? Качество практически не теряется, а размер уменьшается значительно. Да и например, на том же фотоаппарате, первоначальный формат другой (непомню как называется, но тоже вроде этого ТИФФ - не сжатый), а потом сжимается в jpeg.

Нет смысла. Файлы в цвете (градачиях серого) нужны только до момента распознавания.
Но ДО этого момента желательно иметь максимальное качество и не рисковать с джипеговыми артефактами, чтобы максимально точно распозналось. А дальше всё равно всё конвертируется в однобитное.

Author:  Oleg [ 02 Apr 2013 04:41 ]
Post subject:  Re: Как сканировать книги?

radical wrote:
А вот в оттенках серого файл получается в три раза меньше. Хотел прикрепить образец, но прикинул, сколько он будет загружаться на моем ADSL 512K, и передумал. Бумага в книге желтая.
Кстати, какие вы используете вспомогательные программы для обрезки краев, поворота изображения и очистки его от мусора?

Занимался давным-давно и уже толком не помню.
Но когда-то следовал методическим указаниям вот отсюда: http://djvu-soft.narod.ru/b_cr.htm
Мне кажется, там довольно толково изложено, хоть и несколько устарело - рекомендую.

Author:  antabu [ 02 Apr 2013 12:08 ]
Post subject:  Re: Как сканировать книги?

При распознании использую .tif как промежуточный. Виды его сжатия не всегда совместимы между программами IrfanView, Файнридер и DjVu Small.
Недавно обнаружил, что восьмой Файнридер при чистке изображений от мусора портит однобитные фотографии.

Author:  radical [ 03 Apr 2013 03:11 ]
Post subject:  Re: Как сканировать книги?

Vladimir wrote:
Попробуйте отсканировать несколько разворотов, а потом сделать из них djvu - вы сможете прикинуть, какой режим сканирования вам выбрать.

Отсканировал на пробу часть книги с такими параметрами:
600dpi, tif, цветной
Потом прогнал через scantailor и собрал в Djvu small
Вот что получилось:

Attachments:
DjVu Encoded.djvu [1.24 MiB]
Downloaded 725 times

Author:  Volodymyr [ 03 Apr 2013 03:32 ]
Post subject:  Re: Как сканировать книги?

К сожалению, местами не читабельно (например, на двух последних страницах).
На исходных сканах та же картина? Если нет - попробуйте собрать Djvu из необработанных сканов.

Author:  radical [ 03 Apr 2013 03:44 ]
Post subject:  Re: Как сканировать книги?

Это дефекты сканирования, книга в бумажной обложке и плохо раскрывается у корешка. Поначалу пробовал сканировать, не закрывая крышку МФУ, получалось вообще плохо. С закрытой крышкой большинство страниц получается нормально, но иногда такие бока выходят, нужно постоянно следить за качеством сканов. Где-то встречал рекомендацию прижимать рукой или приспособить какой-то груз для этого.
Из необработанных будет совсем плохо, поскольку желтая бумага, листы косо лежат. Я вот еще что думаю, на последнем этапе скантейлор переконвертировал изображение в черно-белое, может оттенки серого нужно было выбрать?

Author:  Volodymyr [ 03 Apr 2013 13:42 ]
Post subject:  Re: Как сканировать книги?

Я книги прижимаю книги руками, в проблемных случаях - двумя сразу (чтобы обложка не пачкалась от частого контакта с пальцами прокладываю лист бумаги). Иногда это идет в ущерб переплету книги, но что делать?

Насчет того, что потеря текста - результат конвертации оттенков серого в черно-белое - вполне может быть (светло-серый становится белым и текст теряется).

Выложите пару исходных jpg проблемных страниц (например, двух последних) - я попробую создать djvu.

Author:  radical [ 03 Apr 2013 14:21 ]
Post subject:  Re: Как сканировать книги?

Vladimir wrote:
Выложите пару исходных jpg проблемных страниц (например, двух последних) - я попробую создать djvu.

Нет смысла, поскольку проблема именно в сканировании, часть страницы возле корешка просто не прижимается к стеклу и текст получается смазанным, а при оптимизации этот кусок, понятное дело, лучше не становится. Эх, книга чужая, а то бы можно было бы разобрать по листику.

Author:  stas [ 03 Apr 2013 14:48 ]
Post subject:  Re: Как сканировать книги?

radical wrote:
Vladimir wrote:
Выложите пару исходных jpg проблемных страниц (например, двух последних) - я попробую создать djvu.

Нет смысла, поскольку проблема именно в сканировании, часть страницы возле корешка просто не прижимается к стеклу и текст получается смазанным, а при оптимизации этот кусок, понятное дело, лучше не становится. Эх, книга чужая, а то бы можно было бы разобрать по листику.

А при фотографировании со штатива такого нет: полкниги я держу под прямым углом, другой рукой жму на спуск. В этом случае разворот не "горбатится", фотографируемая страница лежит ровно (правда, тоже не всегда, но тут есть парочка простых способов, о которых просто нудно рассказывать). Три-четыре секунды - и готово, можно переворачивать страницу.

Author:  radical [ 04 Apr 2013 14:31 ]
Post subject:  Re: Как сканировать книги?

Закончил сканирование справочника, какие будут замечания?

Attachments:
DjVu Encoded.djvu [3.55 MiB]
Downloaded 681 times

Author:  Trel [ 04 Apr 2013 14:47 ]
Post subject:  Re: Как сканировать книги?

По-моему, очень хорошее качество, все более чем читабельно.

Author:  Volodymyr [ 04 Apr 2013 15:05 ]
Post subject:  Re: Как сканировать книги?

У меня лично замечаний нет
(немного трудно читаются две последние страницы, но почти наверняка такая же проблема и в оригинальной книге)

Author:  radical [ 04 Apr 2013 15:12 ]
Post subject:  Re: Как сканировать книги?

Vladimir wrote:
(немного трудно читаются две последние страницы, но почти наверняка такая же проблема и в оригинальной книге)

это даже не страницы, а просто вкладыши были в книге, с несколько худшим качеством, чем остальной текст. Качество после преобразования в djvu еще несколько упало, но зато объем уменьшился, из 25МБ обработанных tif файлов получился 3,55МБ djvu

Page 2 of 4 All times are UTC [ DST ]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/