Открытые данные Москвы — начинаем их анализировать и использовать. Данные о бюджете

Поскольку Московские власти начали активно публиковать открытые данные, пришла самая пора их активно поиспользовать. Поскольку не все из данных пока что удобны и хорошо пригодны для этой цели, то первый шаг — это содержательная и конструктивная критика.

Для начала данные по бюджету.

Я лично не поленился посмотреть данные опубликованные на сайте Открытого бюджета Москвы http://budget.mos.ru/ где в разделе «Данные для IT-разработчиков» http://budget.mos.ru/gp_xml представлены данные в формате XML по государственным программам Москвы.

Я внимательно посмотрел эти данные на предмет того что с ними можно сделать и вот мои краткие выводы:

1. Отсутствует спецификация полей в разделе «Для разработчиков»

Все данные опубликованы в XML формате дампов таблиц где внутри XML файла всё описано в виде типа вот такого:

<fields>
<field name="Key" datatype="Integer" />
<field name="Code" datatype="String" size="50" caption="Код" isUnique="true" />
<field name="Name" datatype="String" size="500" caption="Наименование" isUnique="true" isNull="false" />
<field name="Id" datatype="Guid" />
</fields>

В то время как в спецификации XML http://budget.mos.ru/BinaryData/DESCR_XML смысл полей не раскрыт. Только описаны тэги в XML хотя и понятно что XML тэги не несут здесь смысловой нагрузки, смысл в полях таблиц.

2. Полностью отсутствует описание что означает какая таблица

Помимо описания полей таблиц отсутствует также связное описание структуры таблиц и то что какая из них означает. Вообще-то так не делают, и подобную информацию исполнитель должен был предоставить как минимум заказчику. Например, посмотрим на то как федеральные органы власти описывают собственные данные — http://fias.nalog.ru/Public/NewsPage.aspx

3. Данные в XML файлах дублируются. Выборки кодов ЦСР, ФКР, списка ОГВ — повторяются.

В каждом из XML файлов есть дублирующиеся таблицы которые повторяются. Это таблицы с идентификаторами — ActionTypes, CSRs, ElementTypes, FCPs, FCRs, FOIVs, VRs. Все эти таблицы являются справочниками и вместо того чтобы их один раз предоставить для выгрузки или предоставить их через API — они дубликуются в каждом из XML дампов/

4. В описания данных почему-то упоминаются ФОИВы.

Явно «Прогноз» не почистил внутренности проекта и там остались упоминания про федералов. Таблица FOIVs это подтверждает и там перечисленны многочисленные федеральные органы власти не имеющие отношения к московским программам.

5. Есть данные только по госпрограммам

Что, категорически, не все данные что есть на портале. На портале также существуют данные:

— по бюджетам прошлых лет;

— по структуре долга города;

— по дефициту бюджета;

и многое другое. Иначе говоря как открытые данные предоставляется лишь малый кусок данных.

Как резюме. Московский портал, безусловно, на сегодняшний день лучший из региональных порталов по открытости бюджета. Его можно сравнивать лишь с проектом budget4me.ru созданном по инициативе Комитета гражданских инициатив.

Но и даже у Московского портала есть недостатки, все они, кроме недостатка ряда массивов данных, не критичные. Однако вполне возможно исправление проблем описанных мной выше.

А пока, чтобы с московскими данными было удобнее работать, они также выгружены и преобразованы на Github Информационной культуры — https://github.com/infoculture/mosopendata. Все XML файлы преобразованы в наборы CSV файлов которые можно смотреть и анализировать. Это лишь первый шаг, приведение данных в удобный вид и далее их доведение до ума и результата.

Для того чтобы представить данные наглядно, конечно же, необходимы исторические данные. Необходимы пояснения к таблицам. Были бы данные по бюджетам с 2010 по 2012 годы — я немало мог бы показать применений.

Вот несколько идей:

1. Оценить конкуренцию в Москве по департаментам города и по городским программам

Берем данные из budget.mos.ru по департаментам и программам и берем данные из zakupki.gov.ru по закупкам. Смотрим уровень конкуренции и делаем рейтинги конкуренции по департаментам и по госпрограммам. Где по 10 поставщиков приходит, а где по одному.

2. Общественный мониторинг дорожного строительства

Берем данные из budget.mos.ru по адресной инвестиционной программе по строительству, собираем группу заинтересованных граждан и проходим по городу регулярно по объектам — выкладываем по каждому фотоисторию.

3. Общественный мониторинг отчетности по госрасходам

Берем данные из budget.mos.ru по департаментам и программам и берем данные из zakupki.gov.ru по закупкам. Проверяем что все данные по контрактам доступны в zakupki.gov.ru (по объемам средств).

И так далее.

Этот пост -это мой ответ представителям Московского правительства задающихся вопросам почему пока никто не использует их данные.

About This Author

Яндекс.Метрика