Наработки по геополитическим онтологиям (в Excel)

Если кто помнит, я немало писал про геополитические онтологии в РФ и публиковал ранее онтологию административно-территориального деления в OWL.

Почитать можно тут:

Собственно главной проблемой моделирования оказалось что OWL и RDF всё ещё не столь близки гражданам чем все остальные форматы и модель когда публикуется RDF/OWL документ на основе которого можно получить форматы попроще работает хуже чем модель когда публикуются данные в более простой форме на основе которой можно строить OWL/RDF описание.

Собственно поэтому я решил разместить имеющиеся у меня наработки по онтологиям в тех первичных Excel файлах в которых я их начинал моделировать.

Вот один из этих  файлов:

  • gov_regions — данные для онтологии административно-территориального деления

Это данных по административно-территориальному делению Российской Федерации в части субъектов, военных округов, федеральный округов и магистралей.

И, более подробно что в них входит.

По субъектам федерации:

  • русское и английское название региона
  • код субъекта по конституции, код КЛАДР, код ОКАТО
  • тип субъекта (республика, область и так далее)
  • автомобильные и налоговые коды
  • коды по ГОСТ 7.67 и ISO 3166
  • временная зона
  • принадлежность к военному округу, федеральному округу и экономическому региону
  • код региона в публичных системах Банка России
  • ссылка на русскоязычную Википедию
  • ссылка на раздел региона на сайте kremlin.ru
  • ссылка на профиль региона на сайте правительства
  • ссылка на профиль региона на сайте Минрегиона
  • название должности главы регионы
  • сайт (веб-страница) главы региона
  • название органа исполнительной власти региона
  • ссылка на сайт органа исполнительной власти региона
  • название законодательного органа власти региона
  • ссылка на сайт законодательного органа власти региона
  • ссылка на сайт общественной палаты региона
  • ссылка на сайт уполномоченного по правам человека

По федеральным округам:

  • русское и английское название
  • русская и английская аббревиатура
  • название административного центра
  • ссылка на официальный сайт
  • коды округов с которым граничит данный округ
  • ссылка на Википедию
  • ссылка на DBPedia

По военным округам:

  • русское и английское название
  • русская и английская аббревиатура
  • название административного центра
  • ссылка на раздел округа на сайте Министерства обороны РФ
  • ссылка на сайт и описание (незаполнены)
  • коды округов с которыми граничит данный округ
  • ссылка на Википедию
  • ссылка на DBPedia (незаполнены)

Примечание: В виду того что зонирование по военным округам у нас недавно поменялось и теперь их всего 4, то пока ещё не везде информацию об этом отражена и сами они слабо представлены в информационной части.

По экономическим регионам:

  • русское и английское название
  • русская и английская аббревиатура

По федеральным магистралям:

  • номер трассы
  • коды европейских маршрутов
  • коды азиатских маршрутов
  • русское название
  • ссылка на Википедию
  • длина
  • тип покрытия
  • коды регионов по которым проходит трасса
  • тип трассы (магистраль и т.д.)
  • маршрут (незаполнено)

То чего нет и какие есть органичения:

  • не учитываются исторические данные — переименования, объединения, изменения в территории, изменения кодов, изменения административной структуры и так далее. Все исторические данные пока вынесены за скобки
  • нет ФИО глав регионов, названий областных центров, адресов и контактов администраций и т.д.  — это требует много ручной работы, но, скорее всего, появится позже;
  • пока нет таблицы границ регионов между собой и близлежащими странами;
  • нет целого ряда других административно-территориальных единиц — судебных округов, округов РЖД и так далее.
  • нет описание структуры по отдельным регионам — нет совершенно сознательно, отслеживать их динамику пока затруднительно.
  • нет телефонных и почтовых кодов, в основном, в виду большого их числа и необходимости представления данных в другой форме. Не как полей в таблицах описания регионов, а как отдельных таблиц со ссылками на регионы.

А также вот ещё два файла уже меньшего объёма, касающиеся структуры Администрации Президента и Правительства России:

  • government — данные для онтологии федеральных исполнительных органов власти — федерального правительства
  • kremlin — данные по администрации президента.

Там присутствует описание персон, комиссий, советов, структуры ФОИВ и так далее. В принципе, там, по большей части данные понятные, так что я не буду детально расписывать, но если будут вопросы — задавайте.

К вопросу о том зачем всё это нужно.

Главная цель — это создание каркаса на который в дальнейшем нанизываются различные интересные информационные срезы и данные за счёт того что в каркасе присутствует большое число интерфейсов кодов через которых устанавливаются связи с этими массивами.

Например, по налоговому коду — связь с различными реестрами организаций. По автомобильным кодам — связь с данными об автомобилях. По названиям регионов — возможность мониторинга СМИ по упоминаемости. По ссылкам на Википедию и другие сайты — возможность подтягивания статистических данных о регионе. По данным о границах, по федеральным магистралям, по округам РЖД — оценка интеграции/взаимодействия регионов.

Аналогично для структур описания ФОИВов. По кодам ГРБС связь с бюджетом, по названиям — отслеживание упоминаний, по странице на сайте госуслуг — мониторинг госуслуг, по руководителям — связь с другими государственными и коммерческими структурами. И так далее.

Ранее я уже приводил схемку семейства геополитических онтологий. Её можно посмотреть вот тут  — http://ivan.begtin.name/wp-content/uploads/2010/08/atd_division_3.png и увидеть что эти онтологии — субъектов федерации и ФОИВ там вынесены как основные и остальные от них зависят.

И что же дальше:

1. Я планирую добавить в OpenGovData.ru API или опубликовать дампы вот этих срезов информации. Причём, похоже, API будет предпочтительнее поскольку там проще отдавать иерархические данные в JSON. Соответственно и объём данных будет расширен.

2. Разумеется всё будет под Creative Commons и PDDL (http://www.opendatacommons.org/licenses/pddl/) лицензиями, а то есть Public Domain.

3. Жду предложений по тому чего нехватает, нет ли косяков и так далее.

About This Author

  • http://www.facebook.com/pfedin Peter Fedin

    временной аспект надо добавлять в первую очередь, хотя бы в виде двух полей «дата начала существования в реальности» и «дата окончания существования в реальности». иначе вся эта онтология живёт текущим моментом и не подлежит апдейтам, что делает её полезность очень ограниченной

    • http://ivan.begtin.name Ivan Begtin

      Практически все описанные объекты не перестают существовать в реальности после изменений, они перестают существовать только в текущих данных, но в том что касается принятых нормативных документов, привязки к бюджетам, госконтрактам и тому подобному — связи останутся. Поэтому вопрос исторических данных решается далеко не столь просто как хотелось бы

    • http://id.ykud.ru/ ykud

      Для субъектов и ФО у меня есть со временными изменениями блок данных (включая всякие выделения Северо-Кавказкого ФО, слияния и присоединения субъектов). SCD2.
      Кому-то нужно?

      • http://ivan.begtin.name Ivan Begtin

        Да, конечно нужно.

Яндекс.Метрика