Методические рекомендации по анализу победителей грантов Общественной Палаты

Снимок экрана 2013-08-30 в 13.48.14

Введение

Итак, ранее я приводил большой массив данных которые мы собрали по победителям грантов. В блогосфере бродит уже очень много разговоров о том как и что и кто получил. Вот, например, ни один проект по свободе доступа к информации и открытым данным в ни один из операторов не поддержал, в том числе и наши проекты.

Так что от большой благодарности к операторам за то что мы и многие другие не попали в общую компанию ко всяческим не к обеду упоминаемым организациям, я думаю что будет полезно эти данные по анализировать.

Далее я буду исходить из того что есть журналисты и блоггеры желающие залезть в эти данные поглубже и пойти дальше генерации демотиваторов с забавными картинками. Поработаем с данными.

Что у нас есть?

1. Собранные данные по грантам выложенные в хаб открытых данных — http://hubofdata.ru/dataset/oprf-grants-winners-2013 По каждой заявке есть информация о:

  • название организации
  • код ОГРН
  • краткое название проекта
  • сумма
  • оператор
  • название региона (не всегда)

2. Есть несколько публичных источников информации с которыми можно работать для сбора большего объёма данных.

3. Есть несколько идей в каких векторах и направлениях можно их анализировать.

Первый шаг. Сбор информации

По каждой организации и каждому проекту можно и нужно собрать больше информации. Что у нас есть? И какие ограничения есть?

1. Дополнительные коды.

Для организаций приведен код ОГРН. В различных справочниках и реестрах он встречается сильно реже чем другие коды. Чаще используется код ИНН. Поэтому для каждой из организаций победителей надо собрать их коды ИНН. Узнать их можно в следующих местах:

— Сервис налоговой — http://egrul.nalog.ru — позволяет ввести код ОГРН и получить карточку организации откуда можно получить её ИНН и адрес местонахождения. Бесплатный

— сервис Контур.Фокус — http://focus.kontur.ru (платный)

— сервис Мультстат — http://multistat.ru (платный)

а также СПАРК Интерфакс, Коммесант Картотека и другие.

2. ФИО Руководителя, учредители, адрес регистрации. 

Эту информацию можно получить уже только из платных сервисов по получение выписок по компаниям. Соответственно — через СПАРК Интерфакс, Контур.Фокус и тд. Тут потребуется доступ в одну из этих систем, можно уложится на всё это в 10000-20000 рублей.

Оттуда же можно вытащить адрес регистрации организации.

3. Получение грантов в прошлом

Поднимаем базы грантов с сайтов операторов за прошлые годы и отмечаем какие из них получали те же организации. Эти списки получателей надо будет поискать на сайтах операторов — они были приличнее чем то что публикуется сейчас. Раньше это были списки в виде веб-страниц и Excel файлов.

4. Нормализация и повышение качества данных

Больше половины данных приведено без указания региона и города. Поэтому еще один шаг — это, вручную, или автоматически собрать данные по местонахождению получателя гранта из grants.oprf.ru, где эта информация есть в описании заявки. Также там же есть более подробное описание.

5. Оценка минимальной публичности

По каждой организации проверяем:

  • есть ли у неё веб-сайт
  • есть ли на веб-сайте публичная отчетность за прошлые годы
  • опубликована ли отчетность (сдана ли отчетность) на сайте Минюста — http://unro.minjust.ru/NKOReports.aspx?request_type=nko

Думаем как на основе этих данных оценить уровень прозрачности грантополучателя и строим рейтинг на его основе. Я бы строил так: есть сайт +1 балл, есть публичная отчетность на сайте +4 балла, есть публичная отчетность на сайте Минюста — +5 баллов.

Итого — минимум 0, максимум 10.

6. Госконтракты

По грантополучателям можно подтянуть информацию по их госконтрактам обратившись к реестру контрактов в zakupki.gov.ru

Дополнительная информация

Доп. информация не относится к грантам напрямую, но поможет при сопоставлении их с другими данными. Нужна информация по контексту в котором гранты распределялись:

1. ФИО, должности и организации членов ОП РФ

Полный список необходимо снять с сайта Общественной палаты скрейпером. Рекомендую использовать что-то вроде ScraperWiki или аналогов.

2. Списки конкурсных комиссий каждого оператора

Аналогично — ФИО и должности.

Ручная классификация

Помимо всего вышеперечисленного у нас остается то ограничение что проекты мало описаны и мы можем получить только несколько срезов. Чтобы придать им более понятную форму их необходимо классифицировать вручную.

Классификация должна идти не по названию проекта, а по организации-получателю.

Вот примеры классификационных групп в которые необходимо делить проекты:

  • православие;
  • байкеры;
  • маргинальная молодежь;
  • благотворители;
  • «иностранные агенты».

И так далее. Подумайте как лучше классифицировать и разметьте тегами данные.

Собрали ингредиенты, пора варить

Итак, мы собрали много данных, что с ними можно сделать?

Для начала их надо свести в один табличный файл Excel/OpenOffice. Это будет огромная таблица в более чем 1000 строк и несколько десятков колонок. На основе этих данных мы можем попробовать поотвечать на следующие вопросы

Аналитика

  • Как распределяются гранты по регионам. По деньгам и по числу грантов.
  • Средний размер гранта на оператора грантов
  • Средний уровень прозрачности грантополучателей.
  • Средний уровень прозрачности грантополучателей по оператором грантов.

Аффилированность

  • Как гранты распределяются по персонам. Отдельно по руководителям организаций и отдельно по учредителям.
  • В каких из грантополучателей есть люди «потенциально аффилированные» с членами конкурсных комиссий.
  • Какие из грантополучателей зарабатывают деньги на госзаказе, от кого и по каким темам.

Одиозность

  • Подсчитать расходы средств на одиозные проекты. Отрейтинговать одиозные проекты и подсчитать среднюю одиозность оператора.

Итоги 

Вот собственно всё что и нужно сделать. результаты можно визуализировать множеством способов — таблицами и графиками. А также представить в виде любого желаемого числа статей.

 

 

 

 

 

About This Author

Яндекс.Метрика