Разное

Формат djvu что это – Djvu — что это за формат, чем его открыть и какие программы для чтения файлов в дежавю использовать на компьютере или андроиде

20.10.2020

DjVu — его история, плюсы, минусы и особенности / МакЦентр corporate blog / Habr

В начале 70-х годов американский писатель Майкл Харт (Michael Hart) сумел получить неограниченный доступ к компьютеру Xerox Sigma 5, установленному в университете штата Иллинойс. Чтобы достойно использовать ресурсы машины, он решил создать первую электронную книгу, перепечатав Декларацию независимости США.

Сегодня цифровая литература получила широкое распространение, во многом благодаря развитию портативных устройств (смартфонов, ридеров, ноутбуков). Это привело к появлению большого количества форматов электронных книг. Попробуем разобраться в их особенностях и расскажем историю наиболее популярных из них — начнем с формата DjVu.


/ Flickr / Lane Pearman / CC

Возникновение формата


DjVu был разработан в 1996 году компанией AT&T Labs с одной целью — дать веб-разработчикам инструмент для распространения изображений в высоком разрешении через интернет.

Дело в том, что в то время 90% всей информации все еще хранилось на бумаге, а многие из важных документов имели цветные изображения и фотографии. Чтобы сохранить читаемость текста и качество картинок, приходилось делать сканы в высоком разрешении.

Классические веб-форматы — JPEG, GIF и PNG — позволяли работать с такими изображениями, но ценой объема. В случае JPEG, чтобы текст был читаем на экране монитора, приходилось сканировать документ с разрешением 300 dpi. Цветная страница журнала при этом занимала порядка 500 Кбайт. Скачивание файлов такого объема из интернета в то время было довольно трудоемким процессом.

Альтернативой было оцифровывание бумажных документов с помощью технологий распознавания текста, однако 20 лет назад их точность была далека от идеальной — после обработки финальный результат приходилось серьезно править вручную. При этом графики и изображения оставались «за бортом». И даже если удавалось встроить отсканированную картинку в текстовый документ, терялись некоторые визуальные детали, например, цвет бумаги, её текстура, а это важные компоненты исторических документов.

С целью решить эти проблемы AT&T и разработали DjVu. Он позволил сжимать отсканированные цветные документы с разрешением 300 dpi до 40–60 Кбайт, при размере оригинала в 25 Мбайт. Размеры чёрно-белых страниц DjVu уменьшил до 10–30 Кбайт.

Как DjVu сжимает документы


DjVu может работать как с бумажными отсканированными документами, так и с другими цифровыми форматами, например PDF. В основе работы DjVu лежит технология, разбивающая изображение на три компонента: передний план, задний план и чёрно-белую (битовую) маску.

Маска сохраняется с разрешением исходного файла и содержит изображение текста и прочие чёткие детали — тонкие линии и схемы — а также контрастные картинки.

Она имеет разрешение 300 dpi, чтобы тонкие линии и контуры букв оставались четкими, и сжимается с помощью алгоритма JB2, который представляет собой вариацию алгоритма JBIG2, предложенного AT&T для работы факсов. Особенностью JB2 является то, что он ищет на странице повторяющиеся символы и сохраняет их изображение только один раз. Таким образом, в многостраничных документах каждые несколько последовательных страниц пользуются общим «словарём».

Задний план содержит текстуру страницы и иллюстрации, а его разрешение меньше, чем у маски. Фон без потерь для восприятия сохраняется с разрешением 100 dpi.

Передний план хранит цветовую информацию о маске, и его разрешение обычно понижается ещё сильнее, так как в большинстве случаев цвет текста черный и одинаковый для одного печатного знака. Для сжатия переднего и заднего планов используется вейвлетное сжатие.

Заключительным этапом создания DjVu-документа становится энтропийное кодирование, когда адаптивный арифметический кодировщик превращает последовательности одинаковых символов в бинарное значение.

Достоинства формата


Задачей DjVu было сохранить «свойства» бумажного документа в цифровом виде, позволив работать с такими документами даже слабым компьютерам. Поэтому ПО для просмотра DjVu-файлов обладает возможностью «быстрого рендеринга». Благодаря ей в память загружается только тот кусочек DjVu-страницы, который должен отображаться на экране.

Это также дает возможность просматривать «недокачанные» файлы, то есть отдельные страницы многостраничного DjVu-документа. При этом используется прогрессивная прорисовка деталей изображения, когда компоненты как бы «проявляются» по мере закачки файла (как в JPEG).

20 лет назад, когда был представлен этот формат, загрузка страницы происходила в три этапа: сперва грузилась текстовая составляющая, через пару секунд подгружались первые версии изображений и фон. Уже после «проявлялась» вся страница книги.

Наличие трёхуровневой структуры также позволяет осуществлять поиск по отсканированным книгам (так как есть специальный текстовый слой). Это оказалось удобно при работе с технической литературой и справочниками, поэтому DjVu стал основой для нескольких библиотек научных книг. Например, в 2002 году он был выбран Архивом Интернета в качестве одного из форматов (вместе с TIFF и PDF) для проекта по сохранению отсканированных книг из открытых источников.

Недостатки формата


Однако, как и все технологии, DjVu имеет свои минусы. Например, при кодировании сканов книг в формат DjVu некоторые символы в документе могут подменяться на другие, внешне похожие. Наиболее часто это происходит с буквами «и» и «н», отчего эта проблема получила название «проблема инь». Она не зависит от языка текста и влияет, в том числе, на цифры и другие мелкие повторяющиеся знаки.

Её причина — ошибки классификации символов в кодировщике JB2. Он «дробит» сканы на группы по 10–20 штук и формирует для каждой из групп словарь общих символов. Словарь содержит образцы общих букв и цифр со страницами и координатами их появления. Когда вы просматриваете DjVu-книгу, символы из словаря подставляются в нужные места.

Это позволяет уменьшить размеры DjVu-файла, однако, если отображения двух букв визуально похожи, кодировщик может их или перепутать, или принять за одинаковые. Иногда это приводит к порче формул в техническом документе. Для решения этой проблемы можно отказаться от алгоритмов сжатия, однако это увеличит размеры цифровой копии книги.

Другим недостатком формата является то, что он не поддерживается по умолчанию во многих современных ОС (в том числе мобильных). Поэтому для работы с ним нужно ставить сторонние программы, такие как DjVuReader, WinDjView, Evince и др. Однако здесь хотелось бы отметить, что некоторые электронные читалки (например, ONYX BOOX) поддерживает формат DjVu «из коробки» — так как необходимые приложения там уже установлены.

Кстати, о том, что еще могут приложения для ридеров на базе Android, мы рассказывали в одном из предыдущих материалов.


Ридер ONYX BOOX Chronos

Еще одна проблема формата проявляется при работе с DjVu-документами на небольших экранах мобильных устройств — смартфонах, планшетах, ридерах. Иногда DjVu-файлы представлены в виде скана разворота книги, а профессиональная литература и рабочие документы часто имеют формат А4, поэтому приходится «двигать» изображение в поисках информации.

Однако отметим, что эта проблема также решаема. Проще всего, конечно, поискать документ в другом формате — но если такой вариант невозможен (например, вам нужно работать с большим количеством технической литературы в DjVu), то можно воспользоваться электронными читалками с большой диагональю от 9,7 до 13,3 дюйма, которые специально «заточены» под работу с подобными документами.

Например, в линейке ONYX BOOX такими устройствами являются Chronos и MAX 2 (кстати, мы подготовили обзор этой модели ридера, и в скором времени опубликуем его в нашем блоге), а также Note, который имеет экран E Ink Mobius Carta с диагональю 10,3 дюйма и повышенным разрешением. Такие устройства позволяют спокойно рассмотреть все детали иллюстраций в оригинальном размере и подойдут тем, кому часто приходится читать учебную или техническую литературу. Для просмотра файлов DjVu и PDF используется NEO Reader, который дает настраивать контраст и толщину оцифрованных шрифтов.

Несмотря на имеющиеся у формата недостатки, на сегодняшний день DjVu остается одним из самых популярных форматов для «сохранения» литературных произведений. Во многом это обусловлено тем, что он является открытым, а обойти его некоторые технологические ограничения сегодня позволяют современные технологии и разработки.

В следующих материалах мы продолжим рассказ об истории появления форматов электронных книг и особенностях их работы.



P.S. Несколько оборов ридеров ONYX BOOX:

habr.com

DjVu — Вікіпедія

Матеріал з Вікіпедії — вільної енциклопедії.

DjVu (вимовляється «дежавю́», від фр. déjà vu — дежавю — колись вже бачене) — технологія стискання зображення з втратами, розроблене компанією AT&T спеціально для зберігання відсканованих документів — книг, журналів, рукописів та ін., де наявна велика кількість формул, схем, рисунків та рукописних символів, котрі роблять повноцінне розпізнавання такого документа надзвичайно складним та трудоємним. Також це дуже ефективне рішення, коли необхідно передати всі особливості оформлення документа. Наприклад в історичних документах важливим є не тільки зміст, а й колір, фактура паперу, його дефекти: тріщини, сліди від згинів, плям, залишені сліди предметів тощо.

В основі формату DjVu лежить декілька технологій, розроблених в компанії AT&T. Зокрема:

  • алгоритм відокремлення тексту від фону на відсканованих зображеннях;
  • хвильовий (вейвлетний) алгоритм стискання фону IW44;
  • алгоритм стискання чорно-білого зображення JB2;
  • універсальний алгоритм стискання ZP;
  • алгоритм розпакування «на запит»;
  • алгоритм «маскування» зображень.

В процесі перекодування в DjVu-формат використовується технологія розділення вихідного зображення на три шари: передній план, фон та чорно-білу маску. До кожного з цих шарів застосовуються власні алгоритми стискання.

Ліцензійна інформація[ред. | ред. код]

Був вперше опублікований у 1998 році. AT&T продали технологію компанії LizardTech, котра намагається використовувати її у своїх комерційних цілях. Але, завдяки відкритості формату, для створення та перегляду документів DjVu існує вільнопоширюване програмне забезпечення, доступне для різноманітних платформ. 1 липня 2008 року компанія Celartem Technology Inc., також материнська компанія, відділенням якої є компанія Lizardtech, анонсувала створення нового центру по продажах і управлінні Djvu, який розмістився в Сієтлі, штат Вашингтон (США). Відповідно тепер в Інтернеті підтримка формату здійснюється не з сайту компанії Lizardtech (http://www.lizardtech.com), а з сайту Celartem Technology Inc. (http://www.celartem.com).

Остання версія була випущена в 2006 році.

Програми, що підтримують DjVu[ред. | ред. код]

  • BullzipPDFPrinter — Безкоштовний принтер PDF. Друкує DjVu-файли в PDF ( Файл -> Друк -> Друкувати в pdf
    ). Дозволяє писати документи PDF практично з усіх програм Microsoft Windows. Не містить будь-якої реклами або спливаючих вікон. Підтримуються кілька вихідних форматів: BMP, JPEG, PCX, PDF, PNG, і TIFF. Підтримка української мови.
  • ATT patent 6058214 (1999)
  • DjVu: Краткое техническое введение(рос.)
  • Technical Papers on DjVu Technology(англ.)
  • DjVuZone.org — некомерційний ресурс про формат DjVu
  • WinDjView — зручне вільне рішення для перегляду файлів DjVu на Windows.
  • DjVu Reader — комерційний додаток для перегляду DjVu на Mac OS.
  • DjVu бібліотеки
  • DjVu.org — англомовний портал DjVu-співтовариства.
  • any2djvu — online-сервіс, що дозволяє конвертувати різні документи у формат Djvu. Вхідними документами можуть бути як локальні файли, так і файли, вказані через URL.
  • DJVU — формат для електронних бібліотек. Алгоритми та переваги, програми та їх використання, керівництво користувача.(рос.)
  • www.djvu-soft.narod.ru(рос.) — сайт «Создание книг в электронном виде из бумажных книг», присвячений DjVu.
  • pdf2djvu — консольний інструмент перетворення PDF у DjVu

uk.wikipedia.org

Djvu что за формат, читаем книги на компьютере с помощью программ

Djvu что за формат рассмотрим это в этой статье. Он помогает пользователям открывать книги или другие сжатые документы в этом формате. Сегодня разберём несколько лучших подобных программ, которые точно откроют такие файлы. На практике скачаем одну программу, и проверим, как всё это работает.

Djvu, что за формат

читалка дежавюЗдравствуйте друзья! Всегда полезно читать книги или какую-либо другую информацию в свободное время. Со времён появления компьютеров и телефонов люди мало стали использовать обычные книги для чтения. Сейчас, любую книгу можно прочитать в разном формате на телефоне или за компьютером, скачав их предварительно с Интернета. Например, в таких форматах – FB2, PDF, Word и другие.

В этой статье мы будем говорить о формате, который называется Djvu что за формат? В переводе на русский язык – это дежавю. С помощью этого формата через Интернет публикуют книги, которые содержат в себе не только текст, но и разнообразные математические формулы, формы графических рисунков, графиков и другие изображения. Такой формат позволяет сжимать такие книги и их, в большинстве случаев, достаточно сложно перевести в простой электронный документ.

Поэтому, чаще всего для этого дела используется читалка дежавю. Именно её мы и будем использовать дальше, чтобы открыть и посмотреть, что из себя представляет Djvu файл.

к оглавлению ↑

Djvu что за формат, и читалка дежавю

Какие программы, можно скачать с Интернета, чтобы прочитать с помощью них Djvu файлы? В поиске браузера Вы можете выбрать топ 3 самых лучших программ (Скрин 1).

djvu чем открыть windows 7

Давайте разберём их по отдельности:

  1. Djvu Reader. Скачать её можно бесплатно с этого сайта (djvu-reader.info). Это программа имеет небольшой функционал для работы. Разберётся с ней даже новичок. Она позволяет читать различные книги в формате Djvu. Совместима со всеми операционными системами.
  2. Djvu Viewer. Данная программа предназначена для чтения книг в формате Djvu. Она бесплатная и доступна всем пользователям. Через неё книги в таких форматах просматриваются не на компьютере, а в браузере.
  3. Win DJ View. Эта программа так же распространяется в Интернете на бесплатной основе и тоже позволяет читать книги на телефоне и компьютере в таких форматах – DJV,Djvu. Она может создавать группу страниц и управлять их цветом.

Итак, перечисленные программы  позволят нам их открыть на компьютере читалку дежавю и телефоне. Далее, рассмотрим одну программу в действии, с помощью которой мы сможем открыть Djvu файл.

к оглавлению ↑

Пример, как открыть Djvu файл и djvu что за формат

Если Вы скачали книгу в формате Djvu на компьютер, то в загрузках этот файл отобразится в таком виде после разархивирования (Скрин 2).

djvu чем открыть windows 10

Конечно, его запустить невозможно без дополнительной программы. В этом нам поможет утилита для чтения Djvu файлов — Djvu Reader. Сначала откроем браузер и скачаем её с официального сайта. Он был указан выше. Затем, распаковываем архив в любую папку на компьютере (желательно на диск D). Эта программа не требует полной установки на компьютер.

В файле программы есть основной файл, нажмите на него, чтобы программа открылась (Скрин 3).

читать дежавю файлы

Затем, откроётся сама программа. Через неё мы и откроем наш скачанный ранее Djvu файл. Итак, как открыть Djvu файл? Всё просто. Запускаете программу, нажав  на неё два раза левой кнопкой мыши, затем нажимаете «Файл» далее «Открыть» (Скрин 4).

читалка djvu

Впоследствии мы выбираем дежавю файл и он автоматически загружается  с компьютера (Срин 5).

чем открыть djvu файл

В качестве примера, я скачал книгу «Анатомия души», в этом формате и тем самым ради интереса можно посмотреть, как всё это работает. Чтобы Вам было удобно читать книгу, в этой программе есть стрелки «Вперёд» и «Назад», которые расположены вверху (Скрин 6).

как открыть djvu файл

Они позволят Вам сделать чтение книги гораздо комфортнее. Можете посмотреть также видео, где показано, как работать в программе Djvu Viewer:

к оглавлению ↑

Заключение

Итак, мы рассмотрели, что из себя представляет djvu что за формат? И научились пользоваться программами для чтения. Все они работают по одному и тому же алгоритму, разве что у них может быть разный интерфейс. Думаю, рассмотренные нами программы в статье помогут Вам открыть с лёгкостью любой Djvu файл. Выбирайте именно ту программу, которая будет для Вас удобной. Удачи Вам!

С уважением, Иван Кунпан.

Просмотров: 184

Получайте новые статьи блога прямо себе на почту. Заполните форму, нажмите кнопку «Подписаться»

Вы можете почитать:

biz-iskun.ru

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *