Продолжение истории с бюллетенями Счетной Палаты

Тем кто не в курсе проблемы, про неё можно прочитать тут — Проблема с чтением бюллетеней Счетной Палаты

Собственно, продолжение этой истории:

1. Письмо я отправил ещё в среду, 23 го числа в 17:46. Ответа никакого не получил. Впрочем Счетная Палата это не орган исполнительной власти, как я помню на них требования по работе с обращениями граждан не распространяются.

В общем, ответа пока нет — хотя на мой взгляд зря. Я предпочитаю конструктивную критику.

2. Проблема, похоже, именно что техническая, очень неприятная и хуже чем просто проблема с бюллетенями.  Дело в том что на сайте Счетной Палаты практически все документы публикуются в PDF формате.

Например, Google утверждает существование 2 340 PDF документов на сайте Счетной Палаты.

При этом большая часть из них созданы с помощью PDF-XChange 3.60.0102 обладают проблемами озвученными мною постом выше:

— по русскому тексту не ищет ни одна «читалка» PDF документов — Acrobat Reader и Foxit Reader

— при копировании текстов выдаются «кракозябры» — текст совершенно нечитаемый

Последующая проверка показала что если попробовать преобразовать эти документы в текстовые с помощью линуксовой утилиты — pdftotext (часть пакета XPdf) то на таких документах она выдаёт ошибку

Error: Unknown character collection ‘PDFXC30-Indentity0’

Но есть некоторые документы которые читаются нормально, например, статья В.Катренко «Проверка проверяющих» потому как она преобразовывалась в PDF с помощью MS Word 2007. Но таких документов явно немного — надо проверять все 2340 чтобы их отсеять.

В общем нехорошо это как то всё. В таком виде документы ничуть не лучше публикации сканов.  А я всегда считал что уж Счетная Палата то получше того же Ростехрегулирования которое балуется публикацией сканов ГОСТов.

Чтобы исправить эту проблему нужно:

Вариант — 1.

Вместо PDF документов публиковать .DOC, .RTF, .XLS и так далее. Как это делают большинство других органов власти. А существующие PDF документы заменить на исходные .DOC документы

Вариант — 2.

Заново переконвертировать все исходные документы в PDF с помощью нормального конвертера — OpenOffice, MS Word 2007  или иного, но с последующей перепроверкой.

Учитывая количество документов — работы в любом случае много, но сделать её всё равно придётся.

UPDATE: Пришёл ответ от их ИТ департамента. Признают что это проблема в конвертере, пообещали публиковать документы используя другой конвертер. В общем — молодцы. Весьма вменяемая реакция на критику.

About This Author

  • http://profiles.yahoo.com/u/TJ4SFR2CUWBPJPLUQJATUZ4LUA Serg Struk

    А цена вопроса была всего-лишь в настройках.
    Если в таких системах настраивать полную оптимизацию по размеру, то нужно быть внимательнее, и посмотреть, не будут ли оптимизироваться и встраиваемые шрифты. В PDF файлах встраиваемые шрифты занимают немало места. Потому и есть такая возможность, как оставить только те символы, которые рисуются. А остальные выбрасываются, и соответственно, коды символов уже не соответствуют стандартной кодировке.
    Если берутся сложные инструменты, то и работать с ними нужно внимательно.
    Проще всего использовать тот же оффисный конвертер. Только оптимизации там символические (точнее, практически никакой).

Яндекс.Метрика