Дорога в тысячу ли начинается с одного шага.
Запустился в самой первой (альфа-редакции) сайт OpenGovData.ru Те кто читал мои размышления по data.gov.ru могут найти там самое начало старта подобного проекта на некоммерческой основе.
Что такое OpenGovData.ru? В первую очередь — это некоммеческий ресурс где сейчас собирается информация по всем общедоступных массивам данных, реестрам, перечням и статистической информации раскрываемой государственными органами и подведомственными ими организациями.
Сейчас основная тема сайта — это систематизация открытой информации предоставляемой государственными органами власти включая последующее раскрытие общедоступной информации в машиночитаемой форме.
Особенность раскрытия данных именно в России в том что качественных данных очень мало. Подавляющее число реестров, перечней и так далее раскрывается в форме непригодной к машинной обработке кроме как специальными средствами — разработанными парсерами.
Этапы сбора и систематизации открытой информации
Сейчас первый и предварительный этап проекта в течении которого происходит сбор информации о публично доступных массивах данных уже раскрываемых в сети. В базе проекта уже содержится информация о 186 различных источников федеральных органов власти, администраций субъектов Российской Федерации и администраций муниципальных образований.
Информация об источнике информации включает следующие данные:
- название;
- описание и комментарии;
- ссылку на подробности описания;
- ссылку на постоянное местонахождение;
- форматы;
- тип источника (API / Массив данных / Каталог ссылок);
- Язык;
- Ответственная организация;
- Копирайт/Условия использования;
- Даты внесения и последнего обновления;
- Тэги
Плюс этот реестр будет активно пополняться — сейчас есть ещё около 130 источников ожидающих верификации и систематизации.Плюс, например, пока ещё нет ссылок на статистику раскрываемую Росстатом, а только там несколько десятков если не сотен таблиц.
Следующий второй этап начнётся с середины/конца мая 2009 года — в разделе открытые данные будут появляться первые обработанные срезы в форматах TSV (Tab-Separated Values), XML, JSON и, возможно, YAML плюс спецификации данных. Также продолжится сбор открытых источников информации в общий реестр.
Некоторые данные у меня уже практически готовы для публикации, сейчас идёт их преобразование в разные форматы.
На третьем этапе данные прошедшие структуризацию будут проходить систематизацию и последующее преобразование в RDF плюс подключение к Linked Data. Точные сроки начала этого этапа сейчас назвать сложно, предположительно середина 2010 года
О других темах
Хотя сейчас на сайте основной акцент на машиночитаемых открытых данных, это не единственная тема которую предполагается там охватить.
Конечный список предполагаемых тем:
- публичные и открытые критерии оценки открытости и результаты мониторинга открытости государственных сайтов ;
- юзабилити/удобство работы с государственными сайтами;
- работа с персональными данными;
- законодательство о раскрытии данных;
Каждая из тем велика сама по себе и я предполагаю каждую из них как отдельным подпроектом в opengov.ru в виде поддоменов или отдельных разделов сайта. Точные сроки их появления сейчас я привести не могу, но до конца этого года будет запущен хотя бы один из подразделов. Если есть жела
Статус проекта
OpenGovData.ru — это некоммерческий и негосударственный проект.
Это означает что:
1. На нём не будет рекламы.
2. Все размещаемые материлы кроме отмеченных отдельно будут доступны под Creative Commons Attribution 3.0 License.
3. На нём не будет коммерческих сервисов.
Сейчас я начинаю его как частную инициативу и, если будут желающие/энтузиасты поучаствовать — приглашаю.
Социальность
Пока в OpenGovData.ru нет возможностей для «социализации» как-то комментарии или а-ля соц. сеть и я лично сомневаюсь что они там нужны, но некая среда общения нужна будет. Это сейчас открытый вопрос и предложения приветствуются.
Как можно помочь проекту
1. Самый простой способ — замечаниями и предложениями.
2. Просмотрев список источников данных и присылая мне новые на [email protected], вскоре появится форма отправки на сайте.
3. Материально не сейчас, но когда будут появлятся открытые данные, начнётся их активная выгрузка и трафик начнёт съедать деньги.
4. Информационно — упоминая в принципе о появлении проекта и привлекая энтузиастов.