3 апреля 2014, 12:38

Document Liberation Project — проект The Document Foundation по «освобождению» цифрового контента

Document Liberation Project
Иллюстрация с сайта Documentliberation.Org

Некоммерческая организация The Document Foundation, стоящая за свободным офисным пакетом LibreOffice, представила свой новый проект для «растущего сообщества разработчиков, желающих освободить пользователей контента от зависимости от поставщика», — Document Liberation Project.

На «проект освобождения документов» возложена реализация следующих задач:

  • попытаться понять структуру и технические особенности проприетарных, недокументированных файловых форматов;
  • использование понимание файловых форматов для реализации библиотек, способных осуществлять парсинг этих документов и извлечение всей возможной информации;
  • использовать существующий фреймворк для преобразования этих данных в Open Document Format (ODF).

Дмитрий Шурупов

Приятно видеть, что господа из TDF не просто представили этот проект, а теперь отчитались о проделанной за год работе. Из рассылки:

During 2014, members of the project released a new framework library,
called librevenge, which contains all the document interfaces and helper
types, in order to simplify the dependency chain. In addition, they
started a new library for importing Adobe PageMaker documents,
libpagemaker, written as part of Google Summer of Code 2014 by Anurag

Existing libraries have also been extended with the addition of more
formats, like libwps with the addition of Microsoft Works Spreadsheet
and Database by Laurent Alonso. He is now working on adding support for
Lotus 1-2-3, which is one of the most famous legacy applications for
personal computers. Laurent has also added support for more than twenty
legacy Mac formats to libmwaw.

Developers have created two export libraries — libepubgen for ePub and
librvngabw for Abiword — and are currently working at improving import
filters for Adobe Freehand — libfreehand — and Apple Pages — libetonyek.
Document Liberation libraries are available for Corel WordPerfect
(including Graphics) and Corel Draw, Microsoft Works, AbiWord, Microsoft
Publisher and Microsoft Visio, Apple Keynote, Adobe FreeHand, Aldus
PageMaker, plus many legacy Mac document formats and many e-book formats.

Each library under the Document Liberation umbrella exists as an
independent project, with its own maintainer, release schedule and
license, according to the Ethos of Free Software which is championed by
The Document Foundation.