Посты в категории: %d0%b0%d0%bd%d0%b0%d0%bb%d0%b8%d1%82%d0%b8%d0%ba%d0%b0

10 ошибок при анализе данных с точки зрения кошачьей статистики

В прекрасном блоге о анализе данных и статистики в частности под названием «Stats with cata» (http://statswithcats.wordpress.com/) или «Статистика с кошками» появился пост под названием «10 фатальных ошибок при анализе данных» — http://statswithcats.wordpress.com/2010/11/07/ten-fatal-flaws-in-data-analysis/

Всячески рекомендую его прочитать.

А сам приведу краткую выжимку:

1. «Где говядина?»   Цифры, выборки и данные без целей,

Читать больше

ГП «Информационное общество». Сухой остаток

Я ранее обещал опубликовать картинки что у меня получались при моделировании ГП «Информационное общество», однако они получались, но не получились — наглядность в них недостаточная и без подтягивания материалов из ФЦП «ЭР» красиво не покажешь.

Однако кое-что я всё же выложу — описание госпрограммы в формате открытых данных.

В Excel файле infosoc_2010-1815

Читать больше

Настоящие открытые данные по иностранной рабочей силе в Москве

Недавно новый градоначальник Москвы потребовал от Департамента труда и занятости начать публиковать информацию о том сколько и куда иностранных граждан запрашивается московскими компаниями и, что самое неожиданное, департамент эти данные действительно опубликовал.

Вот тут — http://www.labor.ru/?id=1064&mod_news_more=17 можно скачать данные за 2010 год и планируемые предложения о потребностях за 2011 год.

Или

Читать больше

Про ГП «Информационное общество». Продолжение

Продолжу прошлый пост по анализу паспорта ГП и приложений.

Что также привлекло внимание.

1. В приложении 1 присутствует 22 индикатора и показателя, но при этом ни в этом приложении ни в других не представлена следующая информация:

— ведомства ответственные за достижения данного индикатора;

— мероприятия результативность которых отражается в данном индикаторе;

— сопоставление индикаторов и

Читать больше

Google Refine — новое название для Gridworks

Для тех кто может быть ещё не знает Google купили компанию Metaweb — создателей FreeBase и Gridworks.

Теперь Gridworks называется Google Refine и доступно по другому адресу https://code.google.com/p/google-refine/

Gridworks, а теперь Google Refine — это один из мощнейших и инструментов по очистке данных. Ему можно на вход подать данные в CSV формате

Читать больше

Про метаданные документов. Без примеров

Последний раз про метаданные в офисных документах я писал более года назад в этой заметке «Извлечение скрытых метаданных из документов MS Office«.

Я какое-то время назад очень активно интересовался этой темой, в последнее время появилось много другого любопытного и метаданные документов отошли на второй план, однако в практических целях иногда

Читать больше

Коллекция драфтов майндмапов

У каждого человека своё хобби. Моё хобби — это анализ окружающего мира и его структуризация, поэтому когда выпадает свободная минута времени, я обычно трачу её на рисование схемок и рисование майндмапов на разные интересные темы.

Некоторые из этих схем потом превращаются в проекты, но многие помогают мне

Читать больше

Про ГП «Информационное общество». Часть 3-я

И промежуточно-завершающий пост на тему всё той же госпрограммы.

Ещё более внимательное прочтение приложения 3 показало что там весьма странная группировка мероприятий.

Фактически в таблице всего 4-колонки: номер задачи, задача программы, мероприятие программы и ответственный исполнитель.

Однако, на самом деле, вместо отдельных задач в колонке «задача программы»  находится несколько задач объединённых в группу

Читать больше

Про ГП «Информационное общество» подробнее

Итак, я закончил какую-то небольшую часть анализа финальной редакции госпрограммы.

«Нюансов» там набралось с избытком, в том числе и чисто бюрократических, но обо всём по порядку.

1. Подпрограммы ГП из её паспорта не идентичны и кое-где не соответствуют подпрограммам из приложения 2, в частности.

а. В паспорте указана подпрограмма «качество жизни граждан и

Читать больше

FreeBase Gridworks released

Появился исходный код Gridworks — http://code.google.com/p/freebase-gridworks/ , а также всяческие интересные примеры там же, в Wiki проекта. Этой такой инструмент по очистке и преобразованию данных сделанный внутри Metaweb’а, компании разработчика проекта Freebase.

И инструмент уж больно интересный и полезный, особенно учитывая что он теперь и с открытым кодом однако я лично

Читать больше

Яндекс.Метрика