Про то чего нет или мало в ГосСети

Продолжая тему Госсети (www.govweb.ru) я расскажу о том чего там нет или же пока очень мало.

Тут будут скорее технические и онтологические нюансы работы с подобного рода данными. «Жареных фактов» тут не будет, но некоторые особенности я опишу.

По информации о госструктурах и сайтах

  • Можно обратить внимание на небольшое число госструктур и их сайтов для МинОбороны (http://www.govweb.ru/govbody/60/) и ФСБ(http://www.govweb.ru/govbody/70/) . Причины этого банальны до невозможности — у их подведомственных учреждений и терр. управлений очень мало веб-ресурсов. Можно убедится в этом здесь — http://www.fsb.ru/fsb/regions.htm и здесь http://www.mil.ru/849/1051/index.shtml. Готов поспорить что из всех структур Вы увидете ссылки на сайты, в лучшем случае, 10%.  Причём если закрытость спецслужб я ещё как-то понять могу, то малая публичность _огромной_ структуры Минобороны поражает.
  • Пока ещё мало ФГУ (http://www.govweb.ru/gbtype/fgu/) и ФГУПов (http://www.govweb.ru/gbtype/fgup/), а также различных ФГУЗ’ов и других форм бюджетных учреждений. Проблема с ними также проста. Во у немногих из них есть свои веб-сайты, во вторых очень многие органы власти не соблюдают 8-ФЗ и не публикуют или же публикуют не полностью информацию о подведомственных учреждениях. Причём, в данном случае, в _разгильдяйство_ я верю больше чем в злой умысел.
  • Администрации муниципалитетов — это отдельная большая история. Во первых по той причине что если всё делать правильно, то необходимо держать у себя полные справочники ОКТМО и ОКАТО и привязывать муниципальные образования к ним, а это означает что необходимо обязательно эти справочники актуализировать хотя бы раз в месяц. Не говоря уже о том что муниципальных сайтов реально много, хотя и, конечно, меньше чем самих муниципальных образований. Поэтому муниципальные ресурсы — это даже не второй, а третий приоритет.

По данным

  • сейчас нет такой информации как:  рекламные блоки Яндекс.Директа и Бегуна,  выявленных SEO ссылок, разработчиков сайтов. Не все эти срезы могут быть быстро получены, но наработки есть. Не буду обещать и загадывать вперёд, но что-то наверняка появится.
  • нет данных о доступности веб-сайтов за счёт пингования или HTTP Ping время от времени. И вопрос вопрос — а надо ли? Нет, конечно, доступность веб-сайта — это важно, но вопрос насколько важно.
  • не все CMS распознаются поскольку их опознавание происходит в режиме «мягкой идентификации», а то есть только на основе данных главной страницы.  Это некое разумное ограничение для минимизации запросов к сайтом чтобы уложить обновление информации в адекватное время .
  • сейчас распознаются только самые популярные счетчики и виджеты. Постепенно будут появлятся и новые. Как я уже говорил — есть отдельный от сайта веб-сервис который, собственно, отвечает только за выявление признаков. Может быть он даже станет публичным, когда-нибудь.

Нюансы

  • есть один большой вопрос как привязывать госструктуры к регионам. Его особенность в том, что если строить полноценную онтологию то быстро выяснится что у большинства госструктур региональных привязок несколько. Это — территориальное местонахождение с точностью до региона или муниципального образования, область ответственности органа власти, местонахождение филиалов  если есть филиалы. Далее оказывается что не все территориальные подразделения привязаны к субъектам федерации. Например, у Минпромторговли России территориальные подразделения привязаны к экономическим округам и унаследованы от передачи функция от Минэкономразвития. А вот у Федерального медико-биологического агентства территориальные управления привязаны даже не к субъектам,  а к конкретным предприятиям. например, посмотрим 107 РУ ФМБА  — http://www.fmba-ru107.narod.ru. Схожая ситуация с ещё рядом ведомств и, в результате, используется некий компромисс привязки госструктуры к региону.

И, наконец, ГосСеть — это гибридный проект где каталог госструктур, госсайтов и различные рейтинги собраны вместе.

В то же время, в похожие проекты в мире есть. Например, германский http://www.bitvtest.eu/ проверяет государственные веб-сайты на доступность для людей с ограниченными возможностями и формирует оценки и рейтинги, а также CMS на которых сайты сделаны. Правда, они это делают вручную и сайтов там мало.

Так что по праву можно сказать что ГосСеть — это первый такой проект в мире.

About This Author

Яндекс.Метрика