Формат DjVu(ДеЖаВю)

Статус
В этой теме нельзя размещать новые ответы.

KiN

Founder
Свой
Регистрация
20 Ноя 2003
Сообщения
1,595
Реакции
1,754
Credits
126
Формат DjVu (ДеЖаВю)

Графический формат DJVU(произносится Дежавю) разработан фирмой AT&T в первую очередь для размещения в Интернет отсканированных изображений. Это могут быть книги, рукописи, географические карты, художественно оформленные меню ресторанов и многое многое другое.
Его уникальной особенностью является черезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). На одной дискете можно разместить до двадцати страниц пригодных для распечатывания на лазерном принтере.
Кроме того, этот формат оптимизирован для передачи по сети таким образом, что страницу можно просматривать еще до завершения скачивания. Таким образом DJVU является уникальным инструментом для открытия Интернет-доступа к фондам обычных, бумажных библиотек.

Продвижением DjVu занимается расположенная в Сиэтле LizardTech Inc. совместно с AT&T Labs. DjVu – открытый стандарт. Доступны как описание формата файла (спецификация), так и исходный код декодера (и части кодировщика).

Обычно DjVu сжимает в 5-10 раз лучше, чем существующие методы вроде JPEG и GIF для цветных документов, и в 3-8 раз лучше TIFF для черно-белых документов. Цветные страницы, сканированные в полном цвете с разрешением 300 DPI могут быть сжаты с 25МБ до 30-100КБ. Черно-белые документы 300 DPI обычно сжимаются до 5-30КБ. Это ставит размер качественно сканированных страниц в один ряд с обычными HTML страницами (занимающими обычно 50КБ)

Для цветных документов содержащих одновременно текст и картинки файлы DjVu обычно в 5-10 раз меньше JPEG файлов того же качества. Для черно-белых страниц DjVu файлы обычно в 10-20 раз меньше JPEG и в 5 раз меньше GIF. Также DjVu файлы в 3-8 раз меньше черно-белых PDF файлов, полученных из сканированных документов (сканировать цветные докумеенты в PDF непрактично).

Помимо сканирования документов DjVu можно применять к документам, созданным другими программами, например Adobe PostScript или PDF. В этом случае размер файла варьируется от 15 до 20КБ за страницу 300 DPI.
---

Линки для более подробного понимания работы данного стандарта

Смежные темы на форуме:
По программе для создания DJVU Файлов - DjVu Editor - http://dumpz.ws/showthread.php?t=20797&highlight=Djvu
По программам для просмотра DjVu-файлов - http://dumpz.ws/showthread.php?t=9488

Что такое DjVu
_http://djvu.khakasia.ru/about_djvu.html

DjVu - все уже было
_http://www.cqham.ru/likbez_djvu.htm

Что такое DJVU и как с ним бороться
_http://www.cqham.ru/djvu_print.htm

Советы по подготовке материалов в электронном и бумажном виде
_http://www.cqham.ru/m2_scan.htm

OCR в djvu файлах
_http://www.cqham.ru/djvu_ocr.htm

Еще один ресурс, где подробно написано о djvu
_http://www.dstu2204.narod.ru/doc/djvu/djvu.htm

Программы для просмотра:

DjVuReader
_http://dumpz.ws/showthread.php?t=9488

LizardTech Document Express
_http://www.lizardtech.com/solutions/doc/

WinDjView и MacDjView
_http://windjview.sourceforge.net/

DjVu Browser Plug-in (Windows, Mac OS X, UNIX)
ExpressView for PocketPC (PocketPC !!!)

Для просмотра ссылки Войди или Зарегистрируйся
 
Последнее редактирование модератором:
M

metrim

Формат то конечно отличный, обеспечивает огромное сжатие без потерь качества.
"Его уникальной особенностью является черезвычайная компактность при хранении изображений в высоком разрешении (300 DPI и выше). На одной дискете можно разместить до двадцати страниц пригодных для распечатывания на лазерном принтере. "
Значительно больше: книга из 300 стр. с разрешением 300dpi занимает (если правильно обработать) около 1,5мб

Существуют химические, физические и биологические библиотеки сделанные в этом формате.
Однако я столкнулся с одной не приятностью при работе с форматом - отсутствуют возможности защиты файлов (какие есть для Адобовских програм). Допустим сканирую я книгу, чищу, обрабатываю, делаю OCR для обеспечения поиска, но не могу заблокировать копирование OCR текста из книги и экспорт страниц. (А это необходимо мне сделать т.к. такова договоренность с авторами). ПОэтому часто приходится пользоваться более громоздкими pdf файлами.
Может быть кто нибудь посоветует как решать проблему защиты авторских прав силами DjVu?
Кстати опытным путем установлено, что плагин для браузера это наиболее удобное решение для просмотра DjVu..
 
Последнее редактирование модератором:

E-van

Местный
Регистрация
23 Окт 2004
Сообщения
156
Реакции
143
Credits
0
metrim, pdf файл можно очень просто взломать и сделать доступным для редактирования, разве авторы книг об этом не знают?
 
M

metrim

Да взломать то можно что угодно, было бы желание, да нужные програмки.
Однако в джВю нет даже намека на возможность защиты
 

Mirabo

Местный
Регистрация
9 Авг 2004
Сообщения
336
Реакции
115
Credits
0
Как раз сейчас скачиваю файл в этом формате. Кто знает, существуют ли специальные программы для чтения или просмотра этих файлов или все пока только на уровне плагинов к браузерам? Можно ли с конвертировать DjVu в PDF или DOC? Или обратная конвертация из TIFF и JPG в DjVu? Интересно так же, если это такой продвинутый формат по сравненияю с JPG и разрабатывается с 96 года, то почему же не используется в Интернете при верстке сайтов?
 
E

Egoizte

Программа для чтения - в шапке. DjVuReader называется.
Конвертировать можно таким способом: через файнпринт сохраняешь каждую страницу в tiff, потом закидываешь в djvueditor из пакета LizardTech Document Express.
 

Mirabo

Местный
Регистрация
9 Авг 2004
Сообщения
336
Реакции
115
Credits
0
Просмотрел я статьи про этот формат, и, Imho, при всех положительных свойствах, следует отметить большую ложку дегтя: судя по всему, ребята-разработчики софта жутко жадные и хотят снять как можно больше денег, постоянно контролируя распростанение формата в массы. Жадность все и тормозит.
 

Msha

ex-Team DUMPz
Свой
Регистрация
12 Окт 2004
Сообщения
7,116
Реакции
2,559
Credits
0
Heralt, а распечатывать от туда (из djvu) можно? Если можно, то для перевода в PDF проще всего PDF factory распечатать.

На счёт конвертации djvu в другие форматы кто-нибудь ещё может какие варианты предложить?
 
E

Egoizte

Msha, из djvureader нельзя, насчет плагина к эксплореру незнаю.
 

Baka

Турист
Регистрация
17 Ноя 2004
Сообщения
8
Реакции
0
Credits
4
Msha написал(а):
Heralt, а распечатывать от туда (из djvu) можно? Если можно, то для перевода в PDF проще всего PDF factory распечатать.

На счёт конвертации djvu в другие форматы кто-нибудь ещё может какие варианты предложить?


Плагин к експлореру нормально печатает. Нужно только жать на иконку принтера, которая на дежавюшном баре. Возможно придется еще немного пошаманить: некоторые книги у меня печатаются по-человечески только если поставить масштаб 300% а в окошке печати задать, чтобы использовался текущий масштаб. Когда я пытался в пдф-ки печатать, то размер довольно серьезно увеличивался, нужно быть к этому готовым.

По поводу конвертации: это же формат для хранения графики, во что еще его переделать можно? Можно сделать много отдельных файлов-картинок - см. статью про DJVU OCR в шапке, там есть ссылка на программу. Можно, разумеется потом эти картинки распознать и т.д. Но большинство дежавюшек, которые мне попадались, содержали довольно много формул, схем и т.д., а эти элементы очень плохо поддаются распознаванию.


2 Heralt - djvureader вообще какой-то урезанный вышел - у меня в нем поиск не работает, в то время как в плагине к ИЕ все в порядке.
 

Msha

ex-Team DUMPz
Свой
Регистрация
12 Окт 2004
Сообщения
7,116
Реакции
2,559
Credits
0
Я поставил плагтн к эксплореру, теперь смотрю книжки. Могу сказать, что по мне не очень удобно. Т.к. пролиставать страницу приходится стрелочками, а перелистывать Page Down. Пролистывать страницу PageDown лично мне неудобно - не люблю когда изображение резко сменяется. Я теряю место нак отором остановился и это мешает сосредоточится. Вот PDF в Акробате пролистыавть можно плавно. Нажал стрелку вниз и всё. К тому же мышка позволяет задать постоянную скорость движения страницы.
Плагин для просмотра DjVu мне такихъ вещей не позволяет. Возможно спец. программа лучше, но ставить её как-то ломает.

Ну и если честно, нормальный текст смотрится лучше чем сканированное изображение, особенно если сканировали криво лежащие листы. Неприятно, когда текст наклонён то в одну, то в другую сторону.
________________________________________________________________________

Ещё возникло такое сооображение: если текст содержит большое кол-во картинок, то удобнее формат DjVu т.к. обеспечивает наилучшее сжатие с сохранением качества.
В тоже время если в файле только текст и картинок почти нет, то лучше формат PDF. Т.к. распознаный текст засунутый в PDF занимает меньше места.

Конкретный пример: 600 страниц только рисунков в DjVu занимает примерно 9 Мб, а в PDF значительно больше (где-то 20 -30 Мб, как минимум). В тоже время 600 страниц распознаного текста (только текст) займут в PDF всего 5 Мб (или меньше, 130 страниц заняло 900 Кб), в то время как в DjVu останется всё те же 9 Мб.

Если я чего-то не понял - поправьте меня.
 

pariman

ex-Team DUMPz
Местный
Регистрация
10 Мар 2004
Сообщения
1,715
Реакции
999
Credits
0
Спец программы не лучше. DJVU Reader ставить не надо, он просто распаковывается, после чего запускается экзешник.
У меня есть книжка CRC.Concise.Encyclopedia.of.Mathematics.2nd.edition.djv, в которой ~3300 страниц. Размер ~66 метров. Представь сколько понадобилось бы времени на распознание. В pdf, кстати, эта книжка, не знаю правда как, но влезла на диск - 694 метра.
 

leosan

Местный
Регистрация
17 Апр 2004
Сообщения
80
Реакции
28
Credits
120
Zygot,
А как можно конвертнуть из djvu в pdf?/b]

Печатать через FinePrint pdfFactory
 
T

TsAN

Zygot написал(а):
А как можно конвертнуть из djvu в pdf?
Можно так же использовать редактор (наиболее доступен Djvu Solo), позволяющий экспортировать страницы в формате bmp. И уже из этого формата преобразовать в нужный.

Удачи!
 
Статус
В этой теме нельзя размещать новые ответы.

Похожие темы