Форум Химиков - Энтузиастов. Химия и Химики
http://chemistry-chemists.com/forum/

Как сканировать книги?
http://chemistry-chemists.com/forum/viewtopic.php?f=15&t=5003
Page 3 of 4

Author:  Upsidesium [ 04 Apr 2013 17:07 ]
Post subject:  Re: Как сканировать книги?

Vladimir wrote:
(немного трудно читаются две последние страницы, но почти наверняка такая же проблема и в оригинальной книге)

У меня все нормально. По крайней мере я не заметил. Возможно это зависит от программы-просмотрщика.

Author:  radical [ 04 Apr 2013 23:00 ]
Post subject:  Re: Как сканировать книги?

А такой вопрос, если в книге есть график или таблица, занимающие всю страницу и расположенные горизонтально (альбомная ориентация), как лучше расположить эту страницу в электронной книге, как в оригинале или повернуть горизонтально?

Author:  antabu [ 04 Apr 2013 23:18 ]
Post subject:  Re: Как сканировать книги?

Я бы повернул так, чтобы потом при чтении файла не приходилось поворачивать отдельные страницы.
Вчера забыл добавить, что лучше это делать после СканТэйлора, в ФайнРидере (если с распознанием), ИрфанВью или после сборки в djvueditor (если без OCR).

Author:  antabu [ 04 Apr 2013 23:23 ]
Post subject:  Re: Как сканировать книги?

Oleg wrote:
Но есть нюанс - у ПЗС-линейки сканера конкретный шаг пикселей. И естественными являются разрешения кратные этому.
Если не трудно - какую нибудь ссылку по поводу кратности.

Author:  antabu [ 05 Apr 2013 20:44 ]
Post subject:  Re: Как сканировать книги?

radical wrote:
Закончил сканирование справочника, какие будут замечания?

Добавил OCR.
Attachment:

Author:  stas [ 05 Apr 2013 20:58 ]
Post subject:  Re: Как сканировать книги?

Очень хорошо. Утоптать такое в три метра...

Author:  ycheff [ 05 Apr 2013 21:12 ]
Post subject:  Re: Как сканировать книги?

В принципе неплохо. Есть некоторые замечания:
1 - В Скан Тейлоре "поля" не доработаны. Некоторые страницы задраны в верх. Это легко исправляется именно в Скан Тейлоре. При обработке полей надо сделать упорядочивание по высоте и отработать вручную некоторое количество верхних страниц (те, что с малым размером), правильно передвинув поле страницы.
Иногда удобно у нескольких последних (самых высоких) сократить избыток высоты, уменьшить отступы или вовсе сняить галочку о выравнивании размера.
2 - Те страницы, что плохо читаются, можно сделать в цветном режиме или добавить "жирности в черно-белом". Иногда это помогает. Иногда удобно плохо читаемым страницам добавить контраста еще до скан тейлора.

Author:  Oleg [ 06 Apr 2013 01:41 ]
Post subject:  Re: Как сканировать книги?

antabu wrote:
Oleg wrote:
Но есть нюанс - у ПЗС-линейки сканера конкретный шаг пикселей. И естественными являются разрешения кратные этому.
Если не трудно - какую нибудь ссылку по поводу кратности.
Короткая ремарка: я стараюсь, по возможности, излагать мысли из головы, а не копипэйстить их из интернета. Потому готовой ссылки у меня нет.

Обыкновенная логика, говорит мне о том, что интерполированные изображения менее точны.
Т.к. одно дело, когда сканер непосредственно замеряет оптическую плотность в определённых точках, и другое дело, когда он предполагает, какова она в промежутках между теми точками, в которых он может замерить - там применяются всякие методы интерполяции, но в любом случае это лишь предположение об оптической плотности, а не её настоящие значения.
Т.е. если сканером, "родное" разрешение которого 600dpi, вы сканируете с разрешением 300dpi, то сканер просто читает со своей линейки пиксели через один. А вот если вы закажете ему 450dpi,
IIIIIIIIIIIIIII 600dpi
I??I??I??I??I 450dpi - Ну тут зависит от алгоритма в драйвере. В лучшем случае, он отсканирует на 600dpi и проинтерполирует.
I I I I I I I I 300dpi
Ну проиллюстрировал как смог...
Думаю, что в таких случаях, когда надо уменьшить изображение не в целое число раз, лучше использовать специальное ПО, а не полагаться на драйвер сканера.

Author:  Иван Николаевич [ 11 Feb 2014 18:38 ]
Post subject:  Re: Как сканировать книги?

Пришел к такой схеме оцифровки книг с картинками:

Сканы в tiff, в оттенках серого, 600 dpi.
Потом Scan Tailor. Однако более удобна старая версия
Attachment:
scantailor-featured-2013.05.31-32bit-install.rar [5.11 MiB]
Downloaded 716 times

Она в отличие от последней версии, позволяет менять область картинки (например "квадро" и растянуть по желанию) в режиме "смешанный", когда автоматика подводит и распознает, как картинку текст.
Устанавливается и на Windows 7.
Удобно делать все страницы без обложки, иначе выравнивание сбивается. Обложки после.
Полученные обработанные tiff сканы в одну папку и далее кодируем в DJVU программой
Attachment:
djvu_small_v0_4_4.rar [2.22 MiB]
Downloaded 688 times

в опциях ставлю
Attachment:
2014-02-11_213224.gif
2014-02-11_213224.gif [ 22.75 KiB | Viewed 18043 times ]

Тогда картинки выходят неплохо и размер, не очень велик.
Но бывают сбои в порядке страниц, тогда можно скорректировать в программе Djvu Editor Pro 5.

Author:  Trel [ 11 Feb 2014 19:03 ]
Post subject:  Re: Как сканировать книги?

Есть версия и для Linux, причем, как я понял не отличающаяся от виндузятской.

Author:  antabu [ 12 Feb 2014 16:54 ]
Post subject:  Re: Как сканировать книги?

Сам не сканирую, половину своих распознал Файнридером (вторую половину удалось найти уже с ocr). Для кириллицы распознавателя, равного этому нет. Всё дело в том, что многие буквы и латиницы, и кириллицы имеют сходное начертание. И другие проги ищут их в первую очередь в латинской части таблицы символов, получается белиберда из смеси латиницы с кириллицей и найти в ней потом что-либо полезное не удастся.

Author:  Trel [ 12 Feb 2014 17:14 ]
Post subject:  Re: Как сканировать книги?

В принципе, как я понимаю, OCR можно перевести в тот же .doc?

Author:  ycheff [ 12 Feb 2014 18:43 ]
Post subject:  Re: Как сканировать книги?

doc можно выташить прямо из Файн Ридера, загрузив туда pdf.
Но я обычно вытаскиваю текст из Fine Reader'а по фрагментам, иногда наличие форматирования делает кашу в выходном doc-файле. Потом остается исправить ошибки, отредактировать формулы, вставить рисунки, и doc готов.

Author:  Calli [ 28 Jul 2014 10:18 ]
Post subject:  Re: Как сканировать книги?

А если сканера под рукой нет - в библиотеке, например... Но можно пользоваться своим фотоаппаратом... Какие параметры на нем выставить для формата А4?

Author:  Volodymyr [ 28 Jul 2014 13:13 ]
Post subject:  Re: Как сканировать книги?

Calli wrote:
А если сканера под рукой нет - в библиотеке, например... Но можно пользоваться своим фотоаппаратом... Какие параметры на нем выставить для формата А4?

Прежде всего нужно хорошее освещение и чтобы руки не дрожали. Параметры - чтобы размер картинки был 1 Мб и выше, цветная. Желательно поставить разрешение получше, т.к. загрубить можно всегда, улучшить задним числом - нет.

Приходится сразу же просматривать сделанные снимки - чтобы текст не был смазан. Мыльницы часто дают плохое качество.

Author:  Calli [ 28 Jul 2014 16:25 ]
Post subject:  Re: Как сканировать книги?

Vladimir wrote:
Calli wrote:
А если сканера под рукой нет - в библиотеке, например... Но можно пользоваться своим фотоаппаратом... Какие параметры на нем выставить для формата А4?

Прежде всего нужно хорошее освещение и чтобы руки не дрожали. Параметры - чтобы размер картинки был 1 Мб и выше, цветная. Желательно поставить разрешение получше, т.к. загрубить можно всегда, улучшить задним числом - нет.

Приходится сразу же просматривать сделанные снимки - чтобы текст не был смазан. Мыльницы часто дают плохое качество.
У меня зеркалка. Наверное лучше в раве снимать, да?

Author:  Volodymyr [ 28 Jul 2014 16:31 ]
Post subject:  Re: Как сканировать книги?

RAW не имеет смысла - в JPG или TIF. Для зеркалки хватит среднего качества.

Author:  Calli [ 28 Jul 2014 16:34 ]
Post subject:  Re: Как сканировать книги?

Vladimir wrote:
RAW не имеет смысла - в JPG или TIF. Для зеркалки хватит среднего качества.
Спасибо.

Author:  Volodymyr [ 28 Jul 2014 16:47 ]
Post subject:  Re: Как сканировать книги?

Вообще при фотографировании гораздо острее стоит вопрос, чтобы не "размазать" изображение во время съемки. От этого разрешение снимка не спасет по определению.

Author:  radical [ 28 Jul 2014 19:10 ]
Post subject:  Re: Как сканировать книги?

Лучше приспособить какой-нибудь штатив для фотоаппарата, при ручной съемке будет значительное количество брака. Хуже всего, что на маленьком экране фотоаппарата плохо видно, если снимки получаются смазанными и очень обидно бывает это обнаружить уже при просмотре на компьютере.

Page 3 of 4 All times are UTC [ DST ]
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/