Открытые данные — проблемы и решения

Вчера в Институте Стрелка прошла дискуссия об использовании открытых данных для городского планирования и вообще об их пользе для жителей.

Присутствовали я, Максим Дубинин (проект ГисЛаб и вообще много проектов по геоданным), представитель комитета транспорта Москвы и так и не появились представители генплана города.

В дискуссии небыло ничего необычного кроме того что вся аудитория была, в общем, с одним вопросом к представителям власти — «Где данные?». Мало кого интересовали сервисы города, мало кого интересовало то сколь интересные модели создаются чиновники взакрытую и все говорили о том что хотели бы иметь данные чтобы работать с ними самостоятельно.

И вот тут я выделю те аргументы которые чиновники довольно регулярно приводят почему они не могут публиковать данные.

1. Они не владеют данными и вообще получают их от других компаний / департаментов и так далее под NDA.

Аргумент является принятым лишь в одном случае — когда хотя бы есть перечень тех данных которые получены по NDA и с указанием их фактического владельца. Потому как в противном случае можно только верить на слово есть ли у чиновников свои данные или они получают их извне. Почти всегда свои данные есть и есть интересные данные.

2. Пока мы не будем уверены в качестве данных на 100% мы их не выложим (с)

Это очень популярный аргумент основанный на страхе того что значительные массивы данных госорганов недостаточно достоверны и что у них нет ресурсов на поддержание их в актуальном состоянии. Здесь ключевое в том что без привлечения общественности эти данные и не смогут стать достоверными. Только через тысячи глаз и прозрачность можно проверить качество информации. Через тысячи глаз и с помощью профессиональных программистов использующих специальные алгоритмы для верификации.

3. Вы же не даете нам свои данные и мы вынуждены использовать их под вашей лицензией (в адрес OpenStreetMap, Wikipedia и других краудсорсинговых проектов)

Общественные данные создаваемые краудсорсингом сознательно публикуются под открытыми лицензиями и почти никогда не ограничивают использование кроме как упоминанием источника. Использовать их не стесняются коммерческие компании, многие госорганы зарубежом и некоторые в России. Это самый неразумный аргумент поскольку эти данные доступны для всех.

4. А почему бы наоборот бизнесу типа всяких Яндексов, Афиши или ритейлеров не давать нам свои данные?

Потому как в отличии от чиновников бизнес зарабатывает деньги сам, а чиновники работают на деньги налогоплательщиков. Требовать с бизнеса данные можно в тех случаях когда это явно требуется законами о раскрытии информации — с публичных компаний, об экологических программах, об абитуриентах (для университетов), о владельцах (с кредитных организаций) и так далее. А также во многих случаях бизнес раскрывает информацию добровольно. Но в отличии от чиновников они делать этого не обязаны.

5. Мы будем раскрывать чтобы другие на этом зарабатывали!

Не всегда произносится явно, но почти всегда косвенно или витает воздухе. В мыслях чиновников представляется картина что они де пашут на людей, публикуют данные, а деньги на этом будут зарабатывать другие. Часто это усугубляется тем что некоторые наши органы власти или подведомственные им предприятия приторговывают данными. Я считаю что если чиновник начинает думать таким образом ему пора увольняться. Госслужба не место для бизнеса, либо человек это понимает и работает, либо пусть уходит и работает в коммерческом секторе.

6. Людям не нужны открытые данные, им нужны понятные услуги

Ещё любят говорить «сервисы для бабушек». Это очень опасное заблуждение и оно из той же серии что «людям не нужны журналисты достаточно пресс-служб ведомств» или «людям не нужны автомобили достаточно метро» или «людям не нужно уметь читать и писать достаточно специально обученных чтецов и писцов». Иначе говоря — чиновники в России любят ориентироваться на самых низкоквалифицированных потребителей информации. Они плохо понимают что сервисы должны создавать не они, а рынок. Это связано со многими причинами. Причина первая — популизм. В ситуации когда значительная часть населения сильно раздражена властями те ищут способы работать с ними не понимая что это тупиковый путь. Вторая причина — большие бюджеты. На создание мобильных приложений, красивых графиков и сервисов можно выбить куда больше денег чем если просто публиковать открытые данные.

 

Что нам со всем этим делать? Убеждать постоянно при каждой встрече с чиновниками задавать один и тот же вопрос — «Где открытые данные?»

Вот лишь несколько примеров данных которых нет.

* Во многих если не в большинстве регионов России публикуются открытые данные по ЕГЭ в разных форматах от XLS до PDF, но с детализацией до муниципальных образований и как минимум за прошлый год, а чаще и сразу за текущий после экзамена. В некоторых регионах (Амурская область, Московская область, Омская область, Костромская область) и многие другие данные доступны с детальностью до школ и возможностью получить средние баллы по ЕГЭ в рамках школы. Но не в Москве. В Москве убогая статистика за 2010 год — http://www.educom.ru/ru/works/allschool/ega/statistics/index.php и только по всему городу

* Во многих странах (Великобритания, США, Нидерланды) и других, доступна детальная статистика по преступлениям с детальностью до отделения полиции. Но не в России. В России в лучшем случае у нас есть куцая региональная статистика по преступлениям или по ДТП. А уж про детальные полицейские сводки и речи нет.

Так что же делать?

Если Вы журналист — спрашивайте об открытых данных при каждом интервью с каждым чиновником. Ссылайтесь на 601 Указ Президента где они прописаны.

Если Вы разработчик — снимайте данные с сайтов, преобразуйте их из PDF и HTML в машиночитаемые форматы, делайте сервисы и обязательно упоминайте открытые данные как идеологию.

 

About This Author

Яндекс.Метрика