Почему я занимаюсь открытыми данными

Мне тут нередко задают один и тот же вопрос в самых разных формах, но звучащий примерно так: а чего ты занимаешься этими открытыми данными, наверное есть какая-то выгода?

Думаю что вопрос заслуживает того чтобы подробно на него ответить.

Зачем я занимаюсь открытыми данными.

1. Сбором информации в самых разных формах я занимаюсь уже много лет, лет 8 как минимум, это то о чём я уже писал как про инфогикство. Это просто интересно само по себе, главное не забывать «выкапываться» из куч банков данных.

Первая выгода — заниматься тем что интересно

2. Во всём мире движение в сторону открытости данных  сейчас просто таки лавинообразное. Свои порталы по открытости появялются у отдельных муниципалитетов в Европе и Северной Америке. А порталы по PSI появляются даже в Африке. Я считаю что появление российского государственного портала data.gov.ru это вопрос исключительно времени и к тому времени когда станет понятно чтна о решение о его создании принято, то быть существенной частью команды которая его сделает. Может быть даже и возглавить часть этого проекта, как знать.

Вторая причина — создание центра компетенций по открытым данным, открытому государству

3. Открытые данные — это не столько ценность сама в себе, а фундамент для построения множества связанных проектов. При правильном их раскрытии, повторное использование может дать целую массу коммерческих и общественных областей где эти данные могут быть применены. Подмешивание данных о статистике поисковыми системами — один из таких примеров. Знание того как с этими данными работать и как их использовать даёт дополнительные возможности в запуске других проектов.

Третья причина — новые возможности, новые проекты

4. При наличии понимания того как можно использовать открытые данные, то, в частности, на их основе разрабатывать специальные алгоритмы которые могут иметь как прямую так и косвенную коммерческую ценность.  Например, я давно собираю массивы данных из ФИО персон и даже знаю ряд совершенно публичных и открытых. Зачем? Потому как это позволило сделать с одной стороны простой, а с другой точный алгоритм определения пола по ФИО и, с меньшей точностью, национальную принадлежность. А также на основе типовых шаблонов написания ФИО, разбирать их в любой форме написания. Из той же серии мои посты про «расшифровку реальности». Когда знаешь с помощью каких именно источников данных можно обогатить тот или иной код, то можно получить весьма интересную информацию.

Четвертая причина — интересные производные продукты

—-

В общем-то всё просто до безобразия.

About This Author

  • http://twitter.com/xeningem xeningem

    Очень интересно. А с чего начиналось это «увлечение»?

    • http://ivan.begtin.name Ivan Begtin

      С других увлечений по коллекционированию самых разных предметов. Но оказалось что коллекционировать информацию интереснее всего.

  • Ushchent

    Здравствуйте, Иван! Я хочу организовать госданные по Беларуси, некоторое время слежу за Вашими проектами, и у меня уже разбегаются глаза. С чего начинать?

    Я журналист, приходится работать с данными соцопросов, статистикой по коррупции и экон. развитию, рейтингами. Все эти данные, в лучшем случае, существуют в виде таблиц в html, doc или pdf и находятся в разных местах.

    Спасибо,
    Алексей.

    • http://ivan.begtin.name Ivan Begtin

      Здравствуйте, Алексей.

      Как журналисту, Вам более всего может быть интересен формат Datablog по аналогии с тем что делает Guardian http://www.guardian.co.uk/news/datablog

      Если Вы будете периодически публиковать интересные данные в машиночитаемой форме, например, в виде Excel файлов. Отражать ситуацию с тем какие и где данные доступны в Белоруссии — это уже будет важный шаг.

      В качестве следующего шага я могу помочь Вам с созданием сайта по открытым данным в Белоруссии на движке OpenGovData.ru или CKAN. Но для этого нужно будет вначале набрать критическую массу описаний источников открытых данных — хотя бы в 50. И здесь хорошо бы заручится поддержкой какой-либо общественной, образовательной или научной организации поскольку тогда и статус проекта будет выше.

      С уважением,
      Иван Бегтин

      • Ushchent

        Ок, спасибо.
        Просто уточнить хочу. Я правильно понимаю, что идея фикс раскрытия госданных — это создать единый стандарт для машиночитаемых данных? Ну, чтобы, напр., можно было выводить статистику Минналогов за нужный период и за пару кликов сопоставлять ее с данными Генпрокуратуры, Transparency International и т.д.

        Всего,
        Алексей.

        • http://ivan.begtin.name Ivan Begtin

          Создать единый стандарт практически невозможно, слишком уж много разных данных понимание которых требует знания предметных областей. Есть долгосрочная инициатива которая называется Linked Data цель которой приведение банков данных в форму пригодную для интеграции с другими данными по всему миру.

          Основной же целью всех этих инициатив не в унификации, а в повторном использовании. В вовлечении граждан и НКО в создании проектов нацеленных на общественное благо с использованием общедоступной информации. Многочисленные примеры таких проектов можно найти на сайте Sunlight Labs в США.

          • Ushchent

            Понятно, спасибо.

Яндекс.Метрика