Сжатие документов. Итоговая сравнительная таблица

В результате всех экспериментов со сжатием файлов получилась следующая таблица результатов.

Объём Процентов
Без сжатия 70745088 100
OpenDocument используя OpenOffice 20511664 28,99
OpenDocument после OpenOffice с дожатием 10231845 14,46
b2xtranslator* 11266825 15,93
b2xtranslator с дожатием 10937971 15,46
MS Word 2007 20145429 28,48
MS Word 2007 с дожатием 14249582 20,14
* В случае b2xtranslator оценки могуть быть неточными так как иногда он портит файлы — около 1% от общего числа.
Напомню что использовался массив из 566 документов в формате .doc (MS Word 2000/XP/2003) общим объёмом в 70 мегабайт собранный из реальной жизни — это извещения, конкурсная документация и протоколы закупок. Документы преобразовывались в форматы OpenDocument и OOXML с помощью различных инструментов и далее «дожимались» без потери содержимого, качества и совместимости.
По результатам можно сказать что лучшие результаты у дожимания документов OpenDocument которые выдаёт OpenOffice, у того же OpenOffice и худший результат если файлы не дожимать.
b2xtranslator сжимает документы предельно эффективно и дожатие документов после его работы почти не помогает, но его использование это хождение по минному полю ибо часть документов он преобразует с ошибками, а на части просто виснет.
MS Word 2007 по умолчанию сжимает документы не лучше чем OpenOffice и дожатие документов не позволяет приблизится к дожатию документов OpenOffice’ом.
Лично для меня эти эксперименты рассеяли миф что OOXML куда лучше подходит для архивации документов с точки зрения уменьшения их объёма.
About This Author

  • http://weblibs.org.ua/ Карабат

    Если нужно чтоб документ мало места занимал нужно хранить все в txt формате там %сжатия 90-95 процентов

Яндекс.Метрика