Открытые данные в ресурсном государстве

Я не так давно уже делал обзор про открытые данные и российскую специфику, сейчас, прочитав несколько книг Кордонского, подправив терминологию и вообще проникшись точностью описания вижу как все те же проблемы можно описать не просто «в реальности», а «как оно на самом деле» (о разнице между этими понятиями можно почитать тут).

Рыночная экономика и гражданское общество

Собственно, главная проблема открытых данных в России в том что потребность в них может быть обеспечена всего двумя факторами — наличием рыночной экономики и гражданского общества.

Рыночная экономика, особенно с высокой конкуренцией, обеспечивает среду когда предприниматели, коих множество, приходят к согласованной позиции или действиям направленным на открытие информации которая может помочь их бизнесу или же, если приведёт к контролю за бизнесом, то охватит всех, а не малые группы. Например, публичное раскрытие данных акционерными обществами актуально только в условиях рыночной экономики и частью рынка является. В некоторых странах, например, США — это раскрытие уже формализовано настолько что данные в системе SEC публикуются машиночитаемыми много лет. Точно также рынок заинтересован в открытости и доступности информации о техническом регулировании, нормативно-правовом регулировании, информации о госзаказах, официальной статистике и так далее. А то есть в информации наличие которой позволяет извлечь прибыль или сократить расходы. А также есть отдельный сегмент рынка — информационные компании чей бизнес основан на работе с информацией, накоплением баз данных и так далее. Типичными представителями такого рынка можно назвать компании-владельцы крупнейших поисковых систем Google, Yahoo и Microsoft, а также крупные СМИ формирующие свои банки данных, такие игроки cloud-сервисов как Amazon и многие другие.

Гражданское общество, в его полноценном понимании, а не в той форме как оно существует в России в первую очередь заинтересовано в наличии и доступности информации позволяющее контролировать государство и бизнес. Это может быть информация о государственных расходах, чрезвычайных происшествиях, изменении климата, экологической обстановке и так далее. Наличие этой информации в форме пригодной для последующей интерпретации позволяет институтам гражданского общества воздействовать на государство и бизнес максимально эффективно.

Несомненно, также, что, и у рынка, и у гражданского общества интересы могут как совпадать так и напрямую конфликтовать, например, в части данных об экологическом состоянии. Однако, чаще, наличие таких конфликтов и их публичность позволяют найти компромиссные решения.

И, конечно, есть данные которые не являются полезными, напрямую, но могут существенно помочь при работе с другой информацией. Это справочники, классификаторы, геоданные и тому подобная информация, сама по себе, не представляющая особого интереса

Какие бывают данные

При том что далее речь пойдёт о специфики открытых данных в ресурсном государстве, тем не менее приведённая далее классификация типов данных относится не только к России. Её можно применить, в принципе, к любой стране.

Итак, исходя из предполагаемого потребления информации,разделим данные на следующие типы:

  • Ресурсные данные. Это данные обладающие прямой коммерческой или административной ценностью.
  • Контрольные данные. Данные, наличие которых позволяет обеспечить/повысить влияние общества и контроль над органами власти и бизнесом.
  • Справочные и иные данные. Эти данные не обладают прямой коммерческой или контрольной ценностью, но позволяют сформировать каркас для всех остальных данных и создавать удобные информационные продукты.

Это не жёсткая типизация и, на практике, бывают пересечения когда данные могут быть использованы для контроля и быть ресурсными, и даже справочными одновременно. Но чаще, всё таки, деление есть и оно заметно.

Основной интерес, конечно, здесь представляют ресурсные и контрольные данные, поскольку их публичность или непубличность непосредственно влияют на возможности ведомств в вопросах административного торга. Публичность ресурсных данных не позволяет их монетизировать или конвертировать в другие блага, а публичность контрольных данные позволяет гражданам/СМИ/НКО (гражданскому обществу) влиять на госструктуры больше чем им бы этого хотелось.

Разумеется, большинство государственных структур не заинтересовано в их публичности и старается обеспечивать их доступность в пределах их минимальных обязательств.

Примеры

Чтобы понять как и что происходит рассмотрим несколько примеров в подробностях.

Например, данные  ЕГРЮЛ. Это единый справочних всех юридических лиц в Российской Федерации который ведётся налоговой службой. Это типичный пример, ресурсных данных потребность в которых есть у практически всех кто занимается бизнесом в нашей стране. Необходимо получать собственные выписки из ЕГРЮЛ, многие проверяют своих контрагентов, ведут бизнес разведку и так далее. Этот массив, несомненно, имеет значительную ценность, но благодаря тому что он «в реальности» и «на самом деле» уже четко регламентирован. А то есть, ФНС России совершенно официально предоставляет к нему доступ за большие деньги, фактически, узаконен рынок посредников в получении данной информации. Вероятность что она станет общедоступна, фактически стремится к нулю. Основной потребитель рынок, известны регламенты получения информации, стоимость получения не столь высока.

Другой пример, рассмотрим базу ГОСТов ведомую Ростехрегулированием. Здесь ситуация куда сложнее. У этой информации «в реальности» есть статус общедоступной, но меры предпринимаемые этим ведомством по ограничению к её повторному использованию беспрецедентны. Достаточно взглянуть на публикуемые в виде постраничных сканов документы на http://protect.gost.ru чтобы в этом убедится. Потому как «на самом деле» и в реальности тоже, существует ФГУП «Стандартинформ» http://nd.gostinfo.ru/ который данную информацию предоставляет на коммерческой основе. При том что эта информация, несомненно, ресурсная, однако голоса рынка неслышно — видно лишь активности гражданского общества в лице ИРСИ, о чём можно почитать у них на сайте http://www.svobodainfo.ru/ru/taxonomy/term/76. Как оно должно быть правильно? Я считаю что тот факт что продажа ГОСТов может быть узаконена — это не самая серьёзная проблема. Потому как, во первых, к сожалению, «голос рынка» по поводу их доступности не слышен, а во вторых при обеспечении прозрачности

Следующий пример — это общероссийские, региональные и отраслевые справочники. По идее, это справочная информация, её общедоступность обеспечивается в виде публикаций всех изменений в нормативно-правовых документов и пытливые умы могут сами составить эти справочники из документов, однако на практике, они нужны в машиночитаемой форме и необходима возможность их обновления. Однако, здесь тоже не всё просто. Большая часть отраслевых и региональных справочников, действительно, доступны без ограничений. Их немашиночитаемость, как правило, не от злого умысла, а от неорганизованности их ведения и сопровождения. А есть и приятные исключения в виде сайта Службы ведения общегородских классификаторов и справочников города Москвы (http://www.mosclassific.ru/) которые предоставляют городские справочники в машиночитаемой форме и Портала информационного взаимодействия Комитета информатизации и связи Санкт-Петербурга (http://portal.iac.spb.ru/) где все городские и часть общероссийских справочников, также, машиночитаемы в форматах DBF. Схожая ситуация со справочником номенклатуры Минэкономразвития который доступен в XLS, фактически, машиночитаем, с КЛАДРов, СОУН и многими другими. Основная проблема возникает со общероссийскими справочниками которые найти актуальные и машиночитаемые одновременно большая проблема.

Ещё один пример, общероссийская статистика собираемая и публикуемая Росстатом. Формально, «в реальности» — эти данные общедоступны на их сайте. Но у статистических данных есть та немаловажная особенность что ценность они приобретают когда есть возможность их анализа и сопоставления, а то есть для данных статистики машиночитаемость это нечто безусловно необходимое. Но, «на самом деле», статистические данные это ресурсные данные и их машиночитаемое раскрытие приведёт к формированию на их основе значительного информационного рынка, а также созданию и развитию уже существующих продуктов. Например, будь данные Росстата машиночитаемы априори, другим ведомствам не пришлось бы запрашивать его руководителей о их использовании, предприятия могли бы их использовать не покупая статистических справочников, а информационные и поисковые компании использовать их в своих продуктах. Яндекс или Рамблер могли бы подмешивать в свою выдачу, а научные и исследовательские учреждения свободно анализировать эти данные и представлять в своих работах.  Я думаю что и так понятно, что будь данные статистики Росстата машиночитаемы, то ведомство лишилось бы чуть ли не главного своего ресурса и, по этой причине, лично я считаю что без принципиальных решений правительства ситуация тут с места не сдвинется.

А также данные о госрасходах публикуемые Минфином в виде бюджетной росписи, Росказной и администрациями субъектов в виде реестров контрактов.  Это типовой пример контрольных данных. Да, они могут быть полезны рынку, но, в основном, это инструменты мониторинга и контроля общества за государством и тем куда оно тратит деньги налогоплательщиков. Ситуация здесь куда лучше чем могла бы быть. Большая часть этих данных, за редким исключением, близка к машиночитаемости. Другое дело что ситуация с гражданским обществом у нас, мягко скажем, не очень и доступность данных не означает наличие тех кто систематизированно с ними работает.  Впрочем, это же касается всех остальных контрольных данных. В основном эти данные используют СМИ для ажиотажа или компромата. Однако, на них, например, удалось запустить проект РосГосЗатраты.

Выводы и ответ на вопрос «Что делать»

Выводов из всей этой ситуации несколько.

Во первых появление data.gov.ru возможно и даже без жёсткого сопротивления органов власти в случае если данные которые там будут содержаться будут носить справочных характер. Такой информации у госорганов очень много, вопрос лишь в её систематизации и организации. И даже польза от этого будет, поскольку наличие этой справочной информации способно помочь в улучшении уже существующих проектов.

Во вторых доступ к контрольным данным — это вопрос не технический, а социально-политический поскольку публичность подобного рода информации — это чистой воды политика. Но, в ситуации неразвитой среды гражданского общества, эффект от усилий будет невелик поскольку главная ценность открытых данных в их повторном использовании. Если же они не используются то и инициатива развития не получит.

В третьих, рассчитывать на раскрытие ресурсных данных, без поддержки со стороны их потребителей и лоббирующих структур этих потребителей — бессмысленно, поскольку для граждан не являющихся основными пользователями этой информации, борьба за их открытость не более чем шоу.

Кстати, большинство систем PSI и каталогов открытых данных содержат именно справочную информацию. Оттого и их популярность не столь высока как хотелось бы. Поскольку в странах где такие инициативы идут, госчиновники тоже не сами себе враги и информацию позволяющую контролировать их работу стараются публиковать по минимуму.

Делать же надо всё тоже и сейчас, но когда вопрос касается данных позволяющих контролировать органы власти, такие как подробные и структурированные сводки о ЧС, результаты экомониторинга, принятия нормативно-правовых актов и так далее, то надо готовится к сопротивлению госорганов и предложению очень конкретных мер, самостоятельной разработке форматов и извлечению нужной информации из разных источников.

About This Author

Яндекс.Метрика