OpenGovData.ru — ранний анонс

Дорога в тысячу ли начинается с одного шага.

Запустился в самой первой (альфа-редакции) сайт OpenGovData.ru  Те  кто читал мои размышления по data.gov.ru могут найти там самое начало старта подобного проекта на некоммерческой основе.

Что такое OpenGovData.ru? В первую очередь — это некоммеческий ресурс где сейчас собирается информация по всем общедоступных массивам данных, реестрам, перечням и статистической информации раскрываемой государственными органами и подведомственными ими организациями.

Сейчас основная тема сайта — это систематизация открытой информации предоставляемой государственными органами власти включая последующее раскрытие общедоступной информации в машиночитаемой форме.

Особенность раскрытия данных именно в России в том что качественных данных очень мало. Подавляющее число реестров, перечней и так далее раскрывается в форме непригодной к машинной обработке кроме как специальными средствами — разработанными парсерами.

Этапы сбора и систематизации открытой информации

Сейчас первый и предварительный этап проекта в течении которого происходит сбор информации о публично доступных массивах данных уже раскрываемых в сети. В базе проекта уже содержится информация о 186 различных источников федеральных органов власти, администраций субъектов Российской Федерации и администраций муниципальных образований. 

Информация об источнике информации включает следующие данные:

  • название;
  • описание и комментарии;
  • ссылку на подробности описания;
  • ссылку на постоянное местонахождение;
  • форматы;
  • тип источника (API / Массив данных / Каталог ссылок);
  • Язык;
  • Ответственная организация;
  • Копирайт/Условия использования;
  • Даты внесения и последнего обновления;
  • Тэги

 Плюс этот реестр будет активно пополняться — сейчас есть ещё около 130 источников ожидающих верификации и систематизации.Плюс, например, пока ещё нет ссылок на статистику раскрываемую Росстатом, а только там несколько десятков если не сотен таблиц.

Следующий второй этап начнётся с середины/конца мая 2009 года — в разделе открытые данные  будут появляться первые обработанные срезы в форматах TSV (Tab-Separated Values), XML, JSON и, возможно, YAML плюс спецификации данных.  Также продолжится сбор открытых источников информации в общий реестр. 

Некоторые данные у меня уже практически готовы для публикации, сейчас идёт их преобразование в разные форматы.

На третьем этапе данные прошедшие структуризацию будут проходить систематизацию и последующее преобразование в RDF плюс подключение к Linked Data. Точные сроки начала этого этапа сейчас назвать сложно, предположительно середина 2010 года

О других темах

Хотя сейчас на сайте основной акцент на машиночитаемых открытых данных, это не единственная тема которую предполагается там охватить. 

Конечный список предполагаемых тем:

  • публичные и открытые критерии оценки открытости и результаты мониторинга открытости государственных сайтов ;
  • юзабилити/удобство работы с государственными сайтами;
  • работа с персональными данными;
  • законодательство о раскрытии данных;

Каждая из тем велика сама по себе и я предполагаю каждую из них как отдельным подпроектом в opengov.ru в виде поддоменов или отдельных разделов сайта. Точные сроки их появления сейчас я привести не могу, но до конца этого года будет запущен хотя бы один из подразделов.  Если есть жела

Статус проекта

OpenGovData.ru — это некоммерческий и негосударственный проект.

Это означает что:

1.  На нём не будет рекламы.

2. Все размещаемые материлы кроме отмеченных отдельно будут доступны под Creative Commons Attribution 3.0 License.

3.  На нём не будет коммерческих сервисов.

Сейчас я начинаю его как частную инициативу и, если будут желающие/энтузиасты поучаствовать — приглашаю. 

Социальность

Пока в OpenGovData.ru нет возможностей для «социализации» как-то комментарии или а-ля соц. сеть и я лично сомневаюсь что они там нужны, но некая среда общения нужна будет. Это сейчас открытый вопрос и предложения приветствуются. 

Как можно помочь проекту

1. Самый простой способ — замечаниями и предложениями.

2. Просмотрев список источников данных и присылая мне новые на ibegtin@gmail.com, вскоре появится форма отправки на сайте.

3. Материально не сейчас, но когда будут появлятся открытые данные, начнётся их активная выгрузка и трафик начнёт съедать деньги.

4. Информационно — упоминая в принципе о появлении проекта и привлекая энтузиастов.


About This Author

  • http://ivanko.buro.com.ru ivanko

    Касательно Росстата — мне кажется, он не является нормативной документацией. Или я ошибаюсь?

  • http://ivan.begtin.name ivbeg

    Дело не в нормативности — дело в том что данные росстата часто нужны при аналитических выборках.

  • http://crider.rork.ru vasyarogov

    А предполагается ли создание или использование каких-либо OWL онтологий? Просто, на мой взгляд, если разработать некую, пускай даже самую общую, онтологии в начале и затем, по мере развития ресурса дополнять ее новыми классами и отношениями, а информационные элементы выражать в экземплярах соответвующих классов, то в итоге это сделает возможной машинную обработку семантики.

    • http://ivan.begtin.name ivbeg

      В дальнейшем, да, предполагается, но прежде чем к OWL онтологии прийти необходимо вначале собрать информацию об имеющихся открытых данных и далее преобразовать их в нечто более простое как то CSV или XML без подробных спецификаций от которых уже приходить к RDF будет проще.

  • http://ivanko.buro.com.ru ivanko

    Мне кажется, что создание онтологий — есть описание структуры государственного управления. Скорее всего будут отражены данные вида уровня подчинения, уровня географии, уровня кодирования. И создание онтологии без учета собираемых данных — это модель государства, а вот с учетом собираемых данных — это фиксация текущего видимого куска. Подходить можно и так, и эдак. Но мне кажется что онтологию имеет смысл начинать писать уже сейчас. Тогда собранные данные будут являться проверкой соответствия заявлемой модели действительности. В обратном случае, будет нужен дополнительный объект проверки =)

  • http://ivan.begtin.name ivbeg

    На днях я представлю драфт XML спецификации под обсуждение и на основе её или с учётом можно будет сделать RDF/OWL спецификацию. Собственно RDF и включение в Linked Data — это долгосрочная цель проекта.

Яндекс.Метрика