Авг 31 2009

Про новый сайт Медведева

Если кто-то ещё не знает то уже обновился сайт президента kremlin.ru .

Интересного там много, как по дизайну так и содержимому. На мой взгляд по дизайну он стал больше походить на Обамовские сайты.

Но ещё важнее что это один из немногих госсайтов с наличием раздела «О сайте» (http://www.kremlin.ru/about/sitedev) где есть информация:

  • о том из чего сайт состоит;
  • статус информации (копирайт);
  • как собираются и собираются ли персональные данные;

и так далее.

Очень качественно сделанный ресурс. Думаю что теперь именно на него начнут равнятся губернаторы и министры при обновлении свои сайтов.


Авг 31 2009

ReWiredState: Гики встречаются с государством

Нашёл интересный и очень правильный проект http://www.rewiredstate.org/

Приведу дословно, то для чего проект создан и с правой стороны мой перевод.

Government isn’t very good at computers.
They spend millions to produce mediocre websites, hide away really useful public information and generally get it wrong. Which is a shame.
Calling all people who make things.
We’re going to show them how its done.
Власти не особенно хороши с компьютерами.

Они тратят миллионы чтобы создать посредственные веб-сайты, скрывают действительно полезную публичную информацию и обычно делают дла неправильно. И это позор.

Созывая людей что способен создавать, мы собираемся показать им [властям] как это делается [правильно].

Одним словом энтузиасты собирают различные государственные и не государственные данные и делают правильно сайты которые государство обычно делает неправильно.

Мне лично нравится такой подход. Не критиковать, а делать так как делать правильно.


Авг 31 2009

Открытые данные: Структурированная номенклатура

Tag: data.gov.ru, datasets, opengovdata.ru, госзаказivbeg @ 12:00 пп

Ещё один новый массив данных в OpenGovData.ru – Структурированная номенклатура продукции для государственных и муниципальных нужд.

Номенклатура используется (должна использоваться) при прогнозирование объёмов закупок и в планах-графиках на размещение заказа.

В открытом доступе она есть на сайте zakupki.gov.ru (http://www.zakupki.gov.ru/Default.aspx?link=21) и ещё ряде региональных сайтов, но в машиночитаемой форме нигде нет.

И, к вопросу о наличии других данных в OpenGovData.Ru. Не скрою что данных у меня накопилось куда больше чем сейчас опубликовано, причём часть из них относительно несложно преобразовать из имеющихся форматов в открытые данные, но главные нерешённые вопросы остаются:

1. Как обеспечить обновление данных, например, общероссийских справочников?

2. Какие массивы данных наиболее востребованы?

3. Готов ли кто-нибудь создавать машапы на основе открытых данных или же навигацию по ним и визуализацию нужно будет также делать в OpenGovData.Ru?


Авг 31 2009

OpenGovData: Государственный рубрикатор научно-технической информации

Ещё одно пополнение для OpenGovData.ru – государственный рубрикатор научно-технической информации в машиночитаемых форматах XML, CSV и TSV.

Это не совсем государственная информация в прямом понимании этого термина, но, учитывая что ГРНТИ регулируется ГОСТом 7.0.49-2007 –  http://www.ifap.ru/library/gost/70492007.pdf, то, на мой взгляд, под формат OpenGovData.ru он подходит.

ГРНТИ, кстати – это один из примеров того что формат представления информации _имеет значение_.  В Рунете есть множество ресурсов где он доступен или как документ Word/PDF или через поиск или навигацию, но в машиночитаемой форме найти было просто нереально. Теперь же машиночитаемая форма есть в OpenGovData.ru


Авг 30 2009

Ссылки на 30.08.2009: Федеральные целевые программы

  • http://www.fcpk.ru/ – ФЦП «Научные и научно-педагогические кадры инновационной России» на 2009-2013 годы
  • http://www.kadryedu.ru/ – то ж самое, только другой сайт
  • http://www.fcpro.ru/ – ФЦП «Развитие образования» в 2006-2010 годах
  • http://www.fcp-pbdd.ru/ – ФЦП «Повышение безопасности дорожного движения» в 2006-2012 годах
  • http://fcpkultura.ru/ – ФЦП «Культура России» на 2006-2011 годы
  • http://www.fcpdom.ru/ – ФЦП «Жилище» на 2002-2010 годы
  • http://www.gks.ru/metod/fcp/fcp.html – ФЦП «Развитие государственной статистики России в 2007 – 2011 годах»
  • http://www.russianlang.ru/ – Федеральная целевая программа «Русский язык» на 2006-2010 годы
  • http://www.kadastr.ru/field_of_activity/program/program_passport/ - ФЦП  »Создание автоматизированной системы ведения  государственного земельного кадастра и государственного  учета объектов недвижимости (2002-2008 годы)»
  • http://www.sport-fcp.ru – ФЦП «Развитие физической культуры и спорта в Российской Федерации на 2006 – 2015 годы»
  • http://fcpir.ru/ ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007—2012 годы»

Авг 26 2009

Про персональные данные и 2010 год

У Екатерины Аксеновой в gov-gov.ru появилась запись про НТС по персональным данным в Минкомсвязи. Думаю что всем кто интересуется этой темой почитать будет  интересно и важно.

Вообще же скажу вам не тая что 1 января 2010 года многие давно ждут. Кто со страхом, кто в предвкушении, кто как неизбежного армагеддона.

В любом случае,  учитывая что вступают в силу, и закон о персональных данных, и 8-ФЗ, то, имхо, число исков на их основе должно резко вырасти, да и жаловаться граждане в прокуратуру начнут активно.

Так что можно запасаться попкорном.


Авг 26 2009

О законодательно-загадочном

Просматриваю в очередной раз ряд сайтов федеральных органов власти и поражаюсь одному факту. На многих из них есть разделы «графических копий документов», двух известных российских компаний причём никто не задаётся вопросами (что они делают на официальных сайтах??), а вот ссылок на ГРСПА (Государственная система распространения правовых актов) нигде нет!

При том что там есть все документы федерального законодательства и не в «графических копиях», а в текстовой, пригодной для работы форме.

Вообще я лично ссылки на все эти веб сайты «с графическими копиями» собираю в отдельную коллекцию с двумя целями:

1. Наглядная демонстрация того факта что «формат имеет значение» и форма раскрытия государственной информации должна регулироваться.

2. Пример того как коммерческие компании продвигают свои бренды и, при этом, не повышают, а, по факту, понижают доступность информации в угоду собственным системам.

P.S. Лично я не люблю писать обращения к президенту, но для тех кто любит могу предложить вопрос, а почему же документы в http://document.kremlin.ru недоступны в текстовом формате?


Авг 26 2009

Автоматическое индексирование отсканированных документов

Tag: google, информация, поискivbeg @ 5:01 пп

Сегодня обнаружил интересное явление. Оказывается Гугл научился автоматически индексировать PDF файлы содержащие отсканированные страницы документов. Соответственно эти документы теперь находятся через поиск.

Например, вот такой документ МинЭкономРазвития (ссылка на документ со сканами страниц) можно найти через поиск – например, вот так и щелкнув на ссылку «просмотреть» переходим в Google Docs где ещё одним щелчком на «Обычный формат HTML» документ возвращается в виде текста.

В общем, Google нашли себе ещё один большой срез данных. Осталось лишь дождаться когда поисковик начнет заглядывать в архивы, распознавать текст и объекты на картинках и так далее.


Авг 23 2009

Нестандартные выводы из открытых данных

Tag: data.gov.ru, datasets, opengovdata.ruivbeg @ 11:46 дп

В статье на которую я ссылался в предыдущем посте об открытых данных как гражданском капитале есть одна важная мысль. Это то что одной из важнейшей причин их доступности является то что изначальная информация может быть рассмотрена с совершенно иных ракурсов и приводить нестандартным выводам.

Приведу пару таких выводов из собственной практики:

1. Не менее чем у 90% всех госучреждений отсутствуют свои сервера электронной почты

Большинство сотрудников госорганизаций пользуются бесплатными сервисами почты Mail.Ru, Yandex, Rambler, Google Mail и так далее.  Причём с этих адресов ведётся вполне официальная переписка по служебным вопросам.

Откуда этот вывод? Всё просто. Для него достаточно было взять массив извещений о госзакупках и взглянуть с другого ракурса. Во всех этих извещениях чаще всего присутствует контактный email который очень редко указывает на домен принадлежащий ведомству.

2. До 99% конкурсных комиссий голосуют единогласно

Опять же не вполне очевидный вывод который можно извлечь анализируя протоколы закупок. Подавляющее число конкурсных комиссий всегда голосуют единогласно – за одобрение заявки участника или за отклонение заявки. Что это означает? Что в конкурсных комиссиях отсутствуют конфликты интересов и вопрос того как они  формируются более чем интересен.

Что ещё можно было бы узнать?

Например:

- если бы были доступны данные сводок МЧС и МВД, то помимо банальных наложений их на территорию с оценками криминогенности и пожароопасности, можно было бы также оценивать проводить параллели с движением планет. Иначе говоря, связывать с предсказаниями астрологов.

- имея данные по статистике имён и популярности певцов/актеров/музыкантов/персонажей книг в эти периоды анализировать степень их влияния на общество.

- имея данные по юридическим лицам включающие их название и род деятельности в виде кодов ОКВЭД можно было бы составить частотность употребления различных ключевых слов по темам и создать алгоритм на основе которого, конечно, с высокой степенью допущения предсказывать отрасль компании.

и множество других применений.

Как резюме лишь добавлю что в России открытых данных, в том числе открытых государственных данных, очень много, сотни если  не тысячи источников и те что удалось собрать в opengovdata.ru – это капля в море.

Ключевыми же остаются два вопроса:

1. Систематизация данных – того где и как их можно получить и применить.

2. Желание у граждан работать с данными. Создавать машапы, использовать в своей работе, анализировать и так далее.

Лично я считаю что оба этих вопроса разрешими.


Авг 21 2009

Мощь данных усиленная изобретательностью

Читаю прекрасный текст от Джошуа Тауберера Open Data is Civic Capital: Best Practices for «Open Government Data» – http://razor.occams.info/pubdocs/opendataciviccapital.html

Текст посвящён ценности раскрытия данных и перечню причин почему и как это нужно делать.

Приведу небольшой участок текста.

«Мощь цифровой информации катализировать прогресс ограничена только мощью человеческого сознания. Данные не поглощаются идеями и инновациями порождаемые ими, но являются бесконечным топливом для созидательности. Малые биты информации, успешно найденные, могут произвести огромный скачок в созидательности. Мощь данных может быть усилена изобретательностью и приводить к применениям немыслимым авторами и далекими от изначальной предметной области.»
(«Сопряжение Мощи Цифровых Данных для Науки и Общества»), отчет рабочей группы Office of Science Technology Policy, Executive Office of the President, правительства США)

В оригинале это читается, конечно, лучше чем в моём непрофессиональном переводе. Тех же кого тема заинтересовала предлагаю совместно перевести текст на русский вот тут – http://translated.by/you/open-data-is-civic-capital-best-practices-for-open-government-data/into-ru/trans/


Следующая страница »


Rambler's Top100