Цифры по госпредприятиям в России для тех кто интересуется.
Всего в России государственных предприятий всех типов (ФГУП, ГУП, МУП) - 5028
Из них в федеральной собственности, ФГУПов — 1314
В первоначальных оценках данные разнились из за того что названия многих организаций пишутся в 5-6 вариантах, в итоге много дублей — на сей раз цифры точные. Во [...]
В прошлой заметке я писал про построение объектной карты сайта в практическом применении к поиску новостных страниц на сайтах для распознавания новостей. Разумеется, кроме этого применения есть и множество других, в основном не напрямую коммерческих или самозначных, но вспомогательных для других задач.
Интересно и другое — анализ веб ресурсов очень тесно перекликается с их информационной [...]
http://brand-kaluga.livejournal.com/ — в ЖЖ оказывается проходит «Областной конкурс на разработку концепции использования конкурентных преимуществ Калужской области в целях её дальнейшего социально-экономического развития» анонсированный на сайте администрации области вот уж случайно не найдешь. В администрации Калужской области выкладывают огромные (необработанные) видеофайлы с заседаний и совещаний. Это поинтереснее чем видеоблоги, но качать много. На сайте Орловской области у [...]
Как пример того для чего Скиур может использоваться — в каталоге сайтов Енота Поискуна сейчас 2148 ссылок посвящённым тематике закупок и присутствия российского государства в сети.
В своё время, чтобы не делать каталог просто набором ссылок, для него был создан специальный скрипт который время от времени проходил по ресурсам в каталоге и занимался [...]
Отдельно просто от подборок ссылок хочу отметить блог gov-gov.ru Екатерины Аксеновой.
Если я пишу, в основном, в виде смеси разных тем — e-gov, ИТ, веб и алгоритмы, то Екатерина пишет целенаправлено и подробно именно об электронном государстве и многие интересные новости по теме e-Gov я узнаю читая именно её записи.
Например, именно из её [...]
Минрегион выкладывает онлайн результаты мониторинга бюджетов и ещё ряда показателей — их можно посмотреть по ссылке http://www.minregion.ru/WorkItems/ListNews.aspx?PageID=434
Интересны эти материалы сразу с 3-х точек зрения:
1. Реальные цифры падения бюджетов в регионах в их исчислении и исчислении МинРегиона. Это к вопросу статей на тему «госзаказ нас спасёт». Смотря какой госзаказ и смотря кого — ситуация [...]
Скиур, экспериментальный проект по извлечению новостей из HTML обновился. Основные изменения были внутренними, но кое что будет заметно и пользователям сервиса:
вместо Couchdb теперь используется связка Couchdb + MySQL. Couchdb, конечно, прекрасный продукт, но производительность его пока оставляет желать лучшего. Поэтому иерархические данные, такие как веб страницы краулера хрянятся в Couchdb, а записи и [...]
Размышляя про всё тот же data.gov.ru буду рассуждать тезисно в рамках не столько ведения сколько раскрытия информации. Рассуждения очень предварительные и дискуссионные:
Общие рассуждения
1. Информационный массив != информационная система. Несмотря на некоторое сходство, один массив может формироваться в нескольких системах, а в рамках одной системы может присутствовать несколько информационных массивов.
2. Информационный массив не [...]
В течении последних двух недель было два моих доклада по теме 8-ФЗ — одна в рамках тематики Электронного муниципалитета, другая в рамках темы ОГВ.
В обоих случаях темы очень близкие — каким требованиям необходимо соответствовать госорганам с 1 января 2010 года.
Вообще мне лично очень интересно, а кто же этот закон писал. Дело в том [...]
Я ранее неоднократно писал что при анализе HTML (да и любых других неструктурироанных/полуструктурированных данных) очень важен правильный подбор метрик для анализа. Часть из этих метрик и многие другие используются в Скиуре и ещё ряде алгоритмов анализа HTML о которых я ранее упоминал.
—
Уровень тэга (tag level) — это характеристика тэга веб страницы определяющая [...]
Microsoft Translate
Рубрики
- BI (3)
- CEP (1)
- IBM (13)
- Novell (6)
- WTF (1)
- apple (3)
- apps4russia (1)
- blogging (61)
- couchdb (3)
- data.gov.ru (273)
- datasets (115)
- diagramming (11)
- e-Government (993)
- eGov (1012)
- google (33)
- gtd (5)
- links (65)
- linux (19)
- microsoft (47)
- not so wtf yet (3)
- opengovdata.ru (218)
- opensource (57)
- productivity (2)
- saas (4)
- second life (2)
- security (6)
- semweb (16)
- sun (13)
- virtualization (16)
- vista (2)
- web (223)
- web 2.0 (108)
- whenyouknowthereasonswhy (1)
- wikileaks (1)
- yahoo (11)
- Без рубрики (4)
- Енот Поискун (17)
- Общественное благо (13)
- алгоритмы (73)
- алгоритмы (51)
- аналитика (19)
- антисео (5)
- бывает и такое (8)
- виртуализация (21)
- вопросы (21)
- госзаказ (173)
- задачки (1)
- идеи (29)
- из жизни (95)
- инновации (27)
- интересные проекты (7)
- информация (108)
- книги (2)
- метапост (1)
- открытое государство (116)
- открытые данные (70)
- поиск (93)
- почти несерьёзно (16)
- размышления (128)
- расшифровка реальности (10)
- робототехника (1)
- руководство проектами (3)
- скиур (19)
- социальные сети (46)
- социоранк (9)
- стандарты (22)
- стоит почитать (21)
- футуристика (1)
- электронное государство (1016)
- юзабилити (25)
- юмор (15)
Метки
антиспам госзакупки гослюди госуслуги датасеты дебаты извлечение информации инновации кузьминов метаданные навальный открытое государство открытые данные поиск почти без иронии публичность раскрытие информации расшифровка реальности систематизация социоранг социоранк стартапы форматы файлов футуристика #belyh #rucamp #socamp 94-ФЗ antispam apps4russia icamp icamp2009 md5 ogp open government searchme semweb sha1 ssl usability


