Кто делал электронные книги?

  • Автор темы Egoizte
  • Дата начала

Делали ли вы электронные книги?


  • Всего проголосовало
    186
Статус
В этой теме нельзя размещать новые ответы.

lohness

Профи
Местный
Регистрация
26 Мар 2004
Сообщения
719
Реакции
1,565
Credits
0
OnThink написал(а):
нет. К сожалению, время упущено. Аборт делают только на ранней стадии беременности. ;)

ну не совсем так
скорее даже совсем не так...
и аборты делают на разных сроках
и чистить можно практически любой скан

Конечно сделать из скана с бликующей или черной полосой по диагонали, вряд-ли что удасться.
Но откорректировать контраст и яркость, убрать мусор и многое другое можно.
Превратить бумагу из желтой (серой в ч/б) в белую убрать пятна и детские каляки-маляки можно - главное желание и ВРЕМЯ (куча времени).

Иногда проще все-таки найти оригинал и отсканить снова (если проблема появилась на стадии сканирования)

А вот брать пережатый в pdf или djvu файл, конвертить его обратно в картинки и снова чистить точно не стоит. Обычно "авторы" таких файлов сильно уменьшают размер и как следствие качество сканов.
 

AlexPkr

Местный
Регистрация
22 Авг 2004
Сообщения
54
Реакции
3
Credits
92
Нориально получается делать в FineReader'е.
Распознаешь текст и сохраняешь в pdf и картинки и текст.
 

peps

Местный
Регистрация
24 Фев 2006
Сообщения
65
Реакции
53
Credits
116
Когда готовлю статьи для публикации на сайте то для сканирования изображений пользуюсь Fotocanvas из пакета ACDSee 5.0 очень просто и удобно. Ну а если надо выдрать текст, то конечно это FineReader читает даже старые газетные статьи.
 

Anri

Местный
Регистрация
16 Авг 2005
Сообщения
25
Реакции
65
Credits
42
Без FineReader в этом деле очень сложно обойтись.
Есть, конечно, и другие распознавалки (раньше пользовался, например, CuneiForm), но рабоают они много хуже.
 

lohness

Профи
Местный
Регистрация
26 Мар 2004
Сообщения
719
Реакции
1,565
Credits
0
Отсканировал не одну сотню книжек и журналов
Перевел в электронный вид почти все художественные книги со своего стелажа. Потом принялся за технические и журналы.
Художественную литературу делать легче всего - отсканил, распознал, проверил, вычитал и готово.
Старые книги приходится еще чистить от мусора возникающего из за старой темной (желтой) бумаги.
Журналы, детские и технические книги содержат большое количество иллюстраций. Возникает дилема в каком виде сохранять. Если картинок немного, то формат HTML со вставкой картинок. Если же много и хочется сохранить оформление (особенно журналы и детские) то сохраняю в JPG 300 dpi для своего архива и сжав до 40-50 процентов сохраняю в DJVU для выкладывания в интернете (проблема размера).
Основное время уходит на очистку таких сканов от мусора.
Старая желтая бумага на ч/б становится серой
Да и в цветном варианте белая бумага новых книг тоже не особо белая.
 
  • Like
Реакции: okun

e-lena

Турист
Регистрация
1 Окт 2006
Сообщения
5
Реакции
0
Credits
0
Я делала много электронных книг. Сканировала с хорошим разрешением (300 dpi), потом в Фотошопе выравнивала страницы, делала их белыми (скан у меня получался немного серым), обрезала ненужное. Конечно, это требует времени и сил, но зато потом как приятно такую книгу смотреть. :)
 

Alex Pro

Местный
Регистрация
10 Ноя 2006
Сообщения
25
Реакции
11
Credits
0
Работа та еще... мне очень жаль тех людей , которые занимаются вычиткой и прочим постоянно

Впервые в этом форуме, дай, думаю, загляну. Ну и, конечно, потянуло в книжный раздел, хотя форум нашел ради музыки.
Сам я сканирую книги около 4 лет, сделал около 300 книг, т.е. отсканил более 100 тыс. страниц. Сканю в ФайнРидере (8-м), сам вычитываю, перегоняю в формат word-doc, картинки к избранным книгам сохраняю в JPG в этом же файле или (для особо-художественных изданий отдельно в виде слайд-шоу, обычно с музыкальным сопровождениям). Это, так сказать, для гурманов. Сканю только художественную, биографическую лит-ру, отборное литературоведение, кое-что по искусству (джаз, живопись), кое-какие исторические труды. Пользуюсь только книгами из своей библиотеки, благо собиралась она около 45 лет и собралось около 8 тыс. книг. Собственно и сканить начал из-за того, что после меня моя библиотека скорее всего разбежится по рукам и сгинет, что хоть и обидно, но неизбежно. Сканирование и особенно вычитка (а это не менее 2 проходов) отнимает много времени и здоровья (глаза сильно устают). Постоянно выкладываюсь в б-ке Александра Белоусенко, делаю посты у Кэпа (kpnemo), модерирую форум библиотеки, отдельно выложил все, сделанное мною в библиотечке на Рапиде.ком.
А теперь постараюсь ответить на цитату, вынесенную в начало. Жалеть окрщиков не нужно, каждый из них (я имею ввиду тех, кто этим занимается постоянно и кого признало сообщество коллег по "профессии") занимается этим сугубо по личным соображениям, имеет склонность к просветительству, альтруизму, озабочен низкой общей и сетевой культурой и, наконец, отличается определенным складом характера. Конечно, окрщик должен быть культурен в самом широком смысле слова, очень грамотен, энциклопедически образован, иметь приличный художественный вкус, быть любознательным и контактным. Конечно, все это в идеале, хотя список требований для занятия этой деятельностью я привел далеко неполный.
И последнее. Сканирование и вычитка книг (не технических) предполагает очень вдумчивое перечитывание обрабатываемой книги. Поэтому каждый, кто сканит, делает в первую очередь свои любимые или близкие ему по духу книги. Подчеркну, что работа эта абсолютно бескорыстна и кроме потери времени и зрения других "доходов" не приносит. Но здесь очень важен моральный фактор. Он является определяющим для постоянного занятия этим нелегким делом.
 

borisrs

Местный
Регистрация
17 Сен 2004
Сообщения
28
Реакции
14
Credits
50
Отсканировал чуть более десятка книг. Все перевел в дежавю. Качество меня (и не только) устраивает.
Предпочитаю по возможности делать черно-белый (двухцветный) вариант.
Если есть полутоновые картинки, то можно только эти страницы сделать в сером формате. Важно в начале сканирования не полениться настроить порог чувствительности сканера. Тут надо попробовать разные варианты и выбрать оптимум. Тогда часто удается избавиться от "грязи" еще на этапе сканирования. Любимое разрешение 400 dpi. Сжатие .jpg к сканам текста применять неправильно, т.к. на контрастных переходах появляются хорошо (а на самом деле это плохо) заметные артефакты. Использую формат - Tiff (ч.-б.: без сжатия для дальнейшей переработки и со сжатием CCITT Group4 - для хранения; серый - сжатие Lzw, в программе ACDSee 5.0). Если книга небольшая (до 300 стр.), то можно сжимать с помощью Document Express Editor v5.0.0 Build 16 plus. Можно и большую но тогда лучше по частям. Приходится временами подождать.
Если загнать очень много страниц (более 300), может и зависнуть.
Подробно о создании книг в дежавю написано по Для просмотра ссылки Войди или Зарегистрируйся. Там же куча софта, из которого необходима небольшая часть. OCR я не добавляю. Можно его добавить и после создания книги. Имеется недостаток: русская г становится латинской R.
 

miralita

Местный
Регистрация
27 Окт 2004
Сообщения
9
Реакции
4
Credits
8
В свое время довелось, можно сказать, профессионально заниматься электронными книгами. Сканирование, вычищение в фотошопе, сохранение в TIFF CCITT Group 4, а там в зависимости от пожелания заказчика - либо PageMaker -> принтер, либо в PDF.
Неплохо набила руку на сканировании старых книг, где текст был едва различим даже на глаз. Сканировалось в полноцвете, вытягивались уровни, потом уже руками или фильтрами (в зависимости от результата - фильтры сильно бьют коцаный текст) - убрать шум.
 

Ares_XT

Местный
Регистрация
25 Апр 2007
Сообщения
41
Реакции
35
Credits
58
Делал парочку книг в формате СНМ с бумажного оригинала. Чтобы сделать качественно, нужно МНОГО времени.. Поэтому особенно этим и не занимаюсь. \На заметку: Если есть ксерокс типа WorkCenter 130, то сканирование одной страницы занимает секунд 5.
 

tehspec

Турист
Регистрация
7 Ноя 2007
Сообщения
6
Реакции
0
Credits
8
Приветствую всех собравшихся).
Книжек и журналов отсканил в свое время просто огромное кол-во.
Поначалу пытался переводить их в Word-DOC, но потом забросил эту идею, потому как практически весь материал это техническая литература с огромным количеством формул и картинок.
В итоге стал сшивать в pdf и DjVu, но в максимальном качестве, что бы потом без проблем и потерь читать.
 
В

Владушка

Старая желтая бумага на ч/б становится серой
Да и в цветном варианте белая бумага новых книг тоже не особо белая.

для этого есть регулировка чувствительности к оттенкам серого =)
гораздо хуже вариант, когда исходный аналорговый вариант сильно затерт и засален(а это чаще всего происходит с часто используемой литературой узкой специализации)...
в таких случаях может не помочь регулировка чувствительности к оттенкам серого, т.к. оттенки засаленности и потертый текст в черно-белом варианте приравниваются...
в таком случае иногда легче распознавать цветной вариант страницы, т.к. желтый и серый сильнее отличаются =)
но обычно такие книги стоят затраченных на них усилий и им ну очень рады коллеги =)
 

fed

Турист
Регистрация
2 Фев 2004
Сообщения
20
Реакции
1
Credits
10
Не все так плохо при наработанном опыте. А чем больше вложишь старания, тем качественнее результат.
 
Статус
В этой теме нельзя размещать новые ответы.

Похожие темы