OpenGovData.ru: открытые данные, планы, развитие и отклик

На opengovdata.ru появился новый массив данных, справочник МКБ-10 который можно скачать в формате CSV и использовать в своих практических задачах. Большое спасибо за него, Юрию Кудрявцеву!

Также в сообществе проекта появилась подборка ссылок по открытым данным в мире — http://groups.google.com/group/opengovdataru/browse_thread/thread/6e13f7db8ef7960c

Можно найти самые разные разные проекты в различных странах. Пока ещё там не все ссылки, но постепенно они все там появятся.

Это всё о текущем, теперь же о будущем проекта.

Изначально он создавался как некоммерческий, бесплатный сайт аналогичный многим таким же в мире. Именно таким и предполагается оставить его далее, в том числе на сайте не будет никакой рекламы, контекстной ли баннерной ли. У него некоммерческие, если угодно «подвижнические» цели, и таким он останется.

Вопросы сейчас в том как продолжить его развитие.

В прошлом году удалось собрать большую базу различных источников данных, сделать 4 массива открытых данных, разработать специальный формат раскрытия в XML и создать банк нормативных документов по раскрытию данных в нашей стране.

Но… Всё это пока не решило несколько важных задач:

1. Вовлечение граждан в создание машапов.

При том что находятся волонтёры интересующиеся данными и готовые данными поделится, всё ещё мало социально-востребованных проектов по их повторному использованию. Нет примеров машапов, нет продвижения идеи в массы о том что открытые данные — это хорошо, нужно, полезно и необходимо.

2. Выбор пути сбора открытых данных

Фактически, есть всего два пути сбора открытых данных.

Первый — когда данные опубликованы в каком-либо формате на официальном сайте и они преобразуются в «нормальный вид» в виде XML/CSV и других полезных форматов волонтёрами с помощью специально написанных парсеров.

Второй — когда данные публикуются самими ведомствами в формате пригодном чтобы их можно было включать в реестр открытых данных.

По моему опыту, второй путь в России особенно сложен из-за непонимания чиновниками самого понятия открытых данных. Первый же путь сопряжён с многими издержками в виде необходимости обновлять, оптимизировать и улучшать парсеры.  Какой из этих путей более правильный — большой вопрос. Но, что можно отметить точно, так это необходимость медийной поддержки — нужны статьи, публикации, обзоры и целенаправленная работа в этом направлении. Любая помощь будет кстати.

3. Интеграция

Сейчас в мире постепенно набирает тенденция к унификации раскрытия информации. К использованию открытых форматов, к стандартизации отраслевого раскрытия, например, движения транспорта. Важно не остаться в стороне от происходящего и интегрироваться в общий процесс.

В частности есть несколько возможных направлений:

  • Linked Data — http://linkeddata.org/ — интеграция в общий процесс Linked Data, для начала экспортом метаданных о массивах данных и их источниках.
  • CKAN — http://ckan.net/ — экспорт данных как пакеты CKAN и интеграцией их в этот проект.

4. Расширение

Сейчас в OpenGovData.ru в основном федеральные данные. Их немало, но они далеко не всё и, как ни странно, в регионах немало открытой информации в публичном доступе, важно лишь умение её найти и понять пригодность к автоматическому использованию. А далее актуальна ситуация и с муниципалитетами.

5. Систематизация

На самом деле проблема систематизации она глобальная. И существует много нераскрытых вопросов как собирать данные и c какой стороны заходить со стороны что есть на самом деле или с того что правильно.

  • Строить ли иерархию органов власти и к ним добавлять  описания доступных массивов данных или же первичны именно данные и информация об органах власти вторична?
  • Собирать ли информация о различных интерактивных и полуинтерактивных сервисах дающие выборочные данные? Например, проверка налоговой задолженности или проверка паспорта в ФМС.

И так далее . Вопросов много и наложение геополитической онтологии что я публиковал ранее или же онтологии структуры органов власти  на реестр открытых данных будет непростой задачей и довольно длительной.  Тем не менее к этому постепенно всё будет приведено.

—-

Всё вышеперечисленное о том что происходит и будет происходить в проекте. Но самое главное — это отклик от потенциальных и существующих его пользователей. Критика, замечания, отзывы, предложений — всё что можно сказать и что может проект изменить и улучшить.

About This Author

  • http://twitter.com/ratxor ratxor

    То есть, тебе Иван, необходимо сформировать сообщество. Может быть тебе имеет смысл связаться с Байрамом Аннаковым и делать совместный проект с Empatika Open? Сообщество у них уже есть. Причём, люди там очень продвинутые. Может быть, тебе стоит выступить с презентацией на очередном собрании Empatika Open и рассказать о проекте OpenGovData.

    • http://ivan.begtin.name Ivan Begtin

      Да, цель именно сообщество. Насчёт Empatika Open, я посмотрю чем они занимаются, может быть есть пересечения.

  • http://twitter.com/AlexButakov Alexey Butakov

    Иван, касательно сбора открытых данных. По-моему очевидно, что данные должны быть в нормализованном, структурированном формате публиковаться самими ведомствами. Имея такие данные над ними можно надстраивать интерфейсы для формирования уже неких сервисов аналитических, информационных и т.д. Причем такие сервисы могут делать и граждане, и сторонние компании, коммерческие сервисы и иные. Неиспользование стандартов — это рост рисков, связанных с изменением структуры данных и непонимания их в дальнейшем парсерами, условжения технологии работы с ними, отслеживания, и, как следствие, трудности с формированием сервисов на их основе.

    Тема интересная, имеет важное значение с точки зрения информатизации государства, его открытости, снижения бюрократических барьеров, которые наиболее чувствительны для малого бизнеса. Это очень хорошо соотносится с целями некоторых ассоциаций, например, Опора России. Может быть имеет смысл вести диалог с ними?

    • http://ivan.begtin.name Ivan Begtin

      Насколько я знаю про эти ассоциации, они в основном следят за интересом бизнеса, а не граждан. Если они могут выступить за инициативы по открытым данных — это хорошо, но использовать их как основную движущую силу мне представляется неправильным.

      • http://twitter.com/AlexButakov Alexey Butakov

        Да, они отстаивают интересы того или иного слоя бизнеса, но: 1) Малый и средний бизнес — это не крупный бизнес, это небольшие компании, где интересы граждан и бизнеса очень сильно пересекаются (совпадают) 2) Не все ли равно что отстаивает ассоциация, если это позволит двигать инициативы по открытым данным?
        Согласитесь, что сейчас выделяются деньги и сейчас закладываются основы информатизации, если не использовать структуры, которые уже вхожи во власть, то можно со своими иницативами, мягко говоря, не успеть к столу…

  • Erchan

    Очевидно, что данные должны быть опубликованны самими ведомствами, причем под «опубликованными» я имею ввиду их предоставление в интернете в виде cервиса (REST ..), с тем чтобы их можно было легко потреблять клиентами, для, уже дальнейшего предоставления конечным пользователям в дружелюбном для них виде. А просто так класть эти данные в виде файла
    на сайте не имеет никакого смысла!

    • http://twitter.com/AlexButakov Alexey Butakov

      В общем случае да: госы хостят наборы данных и сервисы доступа к ним, в некоторых случаях интерфейсы для работы с ними, а граждане и коммерческие структуры на их основе могут создавать уже более сложные интерфейсы, машапы, в том числе на коммерческой основе.

      Но в ряде случаев зачем делать сервис ради сервиса? Если данные статичные, разовые, слабо востребованные, то вполне и файлом можно обойтись в структурированном формате. Главное, чтобы они вообще были.

  • http://twitter.com/AlexButakov Alexey Butakov

    В общем случае да: госы хостят наборы данных и сервисы доступа к ним, в некоторых случаях интерфейсы для работы с ними, а граждане и коммерческие структуры на их основе могут создавать уже более сложные интерфейсы, машапы, в том числе на коммерческой основе.

    Но в ряде случаев зачем делать сервис ради сервиса? Если данные статичные, разовые, слабо востребованные, то вполне и файлом можно обойтись в структурированном формате. Главное, чтобы они вообще были.

  • Andrey S

    Иван,вот тебе идея востребованного использования открытых данных.
    На сайтах прокуратуры каждого субъекта федерации публикуется информация о проверках юр лиц надзорными организациями. Данные чаще всего в формате xls и должны сравнительно легко агрегироваться. Тема очень актуальна для бизнеса. Более того, очень активно обсуждалась в СМИ. Я уверен что проект открытого доступа к единой базе проверок с возможностью найти свою организацию (а может быть и подписаться на алерты) будет востребован. Внимание СМИ при открытии проекта я думаю будет обеспечено (попробуй с теми же Коммерсантом и Ведомостями поговорить — их профиль). Ну а под эту тему можно активно пропиарить и опенговдата.
    К большому сожалению, кроме идеи ничего подать не могу. Но уверен, волонтеры найдутся.
    Чтобы проект окупал себя могу дать пару идей монетизации:
    1) вместе с рассылкой алертов можно высылать рекламу организаций которые готовы оказать консультации перед проверкой (например аттестовать по условиям труда перед проверкой трудинспекции или оценить пожарную безопасность перед проверкой пожнадзора)
    2) предоставление профильным специализированным организациям актуальной информации по предстоящим проверкам в их регионе.
    понятно, что речи о сколько-нибудь существенной прибыли тут идти не может, но окупать проект и работу волонтеров я думаю хватит.
    Вот собственно примеры открытой информации по проверкам:
    http://www.mosoblproc.ru/plan/
    http://www.mosproc.ru/svodnyi-plan-proverok-sub
    http://www.krasproc.ru/?Proverki

Яндекс.Метрика