Янв 29

OpenGovData.ru: открытые данные, планы, развитие и отклик

На opengovdata.ru появился новый массив данных, справочник МКБ-10 который можно скачать в формате CSV и использовать в своих практических задачах. Большое спасибо за него, Юрию Кудрявцеву!

Также в сообществе проекта появилась подборка ссылок по открытым данным в мире – http://groups.google.com/group/opengovdataru/browse_thread/thread/6e13f7db8ef7960c

Можно найти самые разные разные проекты в различных странах. Пока ещё там не все ссылки, но постепенно они все там появятся.

Это всё о текущем, теперь же о будущем проекта.

Изначально он создавался как некоммерческий, бесплатный сайт аналогичный многим таким же в мире. Именно таким и предполагается оставить его далее, в том числе на сайте не будет никакой рекламы, контекстной ли баннерной ли. У него некоммерческие, если угодно «подвижнические» цели, и таким он останется.

Вопросы сейчас в том как продолжить его развитие.

В прошлом году удалось собрать большую базу различных источников данных, сделать 4 массива открытых данных, разработать специальный формат раскрытия в XML и создать банк нормативных документов по раскрытию данных в нашей стране.

Но… Всё это пока не решило несколько важных задач:

1. Вовлечение граждан в создание машапов.

При том что находятся волонтёры интересующиеся данными и готовые данными поделится, всё ещё мало социально-востребованных проектов по их повторному использованию. Нет примеров машапов, нет продвижения идеи в массы о том что открытые данные – это хорошо, нужно, полезно и необходимо.

2. Выбор пути сбора открытых данных

Фактически, есть всего два пути сбора открытых данных.

Первый – когда данные опубликованы в каком-либо формате на официальном сайте и они преобразуются в «нормальный вид» в виде XML/CSV и других полезных форматов волонтёрами с помощью специально написанных парсеров.

Второй – когда данные публикуются самими ведомствами в формате пригодном чтобы их можно было включать в реестр открытых данных.

По моему опыту, второй путь в России особенно сложен из-за непонимания чиновниками самого понятия открытых данных. Первый же путь сопряжён с многими издержками в виде необходимости обновлять, оптимизировать и улучшать парсеры.  Какой из этих путей более правильный – большой вопрос. Но, что можно отметить точно, так это необходимость медийной поддержки – нужны статьи, публикации, обзоры и целенаправленная работа в этом направлении. Любая помощь будет кстати.

3. Интеграция

Сейчас в мире постепенно набирает тенденция к унификации раскрытия информации. К использованию открытых форматов, к стандартизации отраслевого раскрытия, например, движения транспорта. Важно не остаться в стороне от происходящего и интегрироваться в общий процесс.

В частности есть несколько возможных направлений:

  • Linked Data – http://linkeddata.org/ – интеграция в общий процесс Linked Data, для начала экспортом метаданных о массивах данных и их источниках.
  • CKAN - http://ckan.net/ – экспорт данных как пакеты CKAN и интеграцией их в этот проект.

4. Расширение

Сейчас в OpenGovData.ru в основном федеральные данные. Их немало, но они далеко не всё и, как ни странно, в регионах немало открытой информации в публичном доступе, важно лишь умение её найти и понять пригодность к автоматическому использованию. А далее актуальна ситуация и с муниципалитетами.

5. Систематизация

На самом деле проблема систематизации она глобальная. И существует много нераскрытых вопросов как собирать данные и c какой стороны заходить со стороны что есть на самом деле или с того что правильно.

  • Строить ли иерархию органов власти и к ним добавлять  описания доступных массивов данных или же первичны именно данные и информация об органах власти вторична?
  • Собирать ли информация о различных интерактивных и полуинтерактивных сервисах дающие выборочные данные? Например, проверка налоговой задолженности или проверка паспорта в ФМС.

И так далее . Вопросов много и наложение геополитической онтологии что я публиковал ранее или же онтологии структуры органов власти  на реестр открытых данных будет непростой задачей и довольно длительной.  Тем не менее к этому постепенно всё будет приведено.

—-

Всё вышеперечисленное о том что происходит и будет происходить в проекте. Но самое главное – это отклик от потенциальных и существующих его пользователей. Критика, замечания, отзывы, предложений – всё что можно сказать и что может проект изменить и улучшить.

  • Erchan
    Очевидно, что данные должны быть опубликованны самими ведомствами, причем под "опубликованными" я имею ввиду их предоставление в интернете в виде cервиса (REST ..), с тем чтобы их можно было легко потреблять клиентами, для, уже дальнейшего предоставления конечным пользователям в дружелюбном для них виде. А просто так класть эти данные в виде файла
    на сайте не имеет никакого смысла!
  • В общем случае да: госы хостят наборы данных и сервисы доступа к ним, в некоторых случаях интерфейсы для работы с ними, а граждане и коммерческие структуры на их основе могут создавать уже более сложные интерфейсы, машапы, в том числе на коммерческой основе.

    Но в ряде случаев зачем делать сервис ради сервиса? Если данные статичные, разовые, слабо востребованные, то вполне и файлом можно обойтись в структурированном формате. Главное, чтобы они вообще были.
  • Иван, касательно сбора открытых данных. По-моему очевидно, что данные должны быть в нормализованном, структурированном формате публиковаться самими ведомствами. Имея такие данные над ними можно надстраивать интерфейсы для формирования уже неких сервисов аналитических, информационных и т.д. Причем такие сервисы могут делать и граждане, и сторонние компании, коммерческие сервисы и иные. Неиспользование стандартов - это рост рисков, связанных с изменением структуры данных и непонимания их в дальнейшем парсерами, условжения технологии работы с ними, отслеживания, и, как следствие, трудности с формированием сервисов на их основе.

    Тема интересная, имеет важное значение с точки зрения информатизации государства, его открытости, снижения бюрократических барьеров, которые наиболее чувствительны для малого бизнеса. Это очень хорошо соотносится с целями некоторых ассоциаций, например, Опора России. Может быть имеет смысл вести диалог с ними?
  • Насколько я знаю про эти ассоциации, они в основном следят за интересом бизнеса, а не граждан. Если они могут выступить за инициативы по открытым данных - это хорошо, но использовать их как основную движущую силу мне представляется неправильным.
  • Да, они отстаивают интересы того или иного слоя бизнеса, но: 1) Малый и средний бизнес - это не крупный бизнес, это небольшие компании, где интересы граждан и бизнеса очень сильно пересекаются (совпадают) 2) Не все ли равно что отстаивает ассоциация, если это позволит двигать инициативы по открытым данным?
    Согласитесь, что сейчас выделяются деньги и сейчас закладываются основы информатизации, если не использовать структуры, которые уже вхожи во власть, то можно со своими иницативами, мягко говоря, не успеть к столу...
  • То есть, тебе Иван, необходимо сформировать сообщество. Может быть тебе имеет смысл связаться с Байрамом Аннаковым и делать совместный проект с Empatika Open? Сообщество у них уже есть. Причём, люди там очень продвинутые. Может быть, тебе стоит выступить с презентацией на очередном собрании Empatika Open и рассказать о проекте OpenGovData.
  • Да, цель именно сообщество. Насчёт Empatika Open, я посмотрю чем они занимаются, может быть есть пересечения.
blog comments powered by Disqus


Rambler's Top100