Публичные доходы — база публичных деклараций чиновников и депутатов

Снимок экрана 2012-03-21 в 11.01.16

Итак пришла пора озвучить еще один новый проект которым мы занимались в прошлом году и немного даже в этом. Это проект — Публичные доходы или publicprofit.ru

Что это такое?

Проект «Публичные доходы» — это база публичных деклараций чиновников и депутатов Российской Федерации раскрываемых согласно требованиям российского законодательства. Проект включает каталог опубликованных источников и базу деклараций доступную для поиска и навигации.

Ну а если совсем уж по простому.

Уже 3 года в России чиновники публикуют декларации. Вернее ведомства публикуют выписки из их деклараций, но все в разных формах и документах. Мы собрали если не все, то очень многие из документов и все что можно было обработать автоматически — обработали. Всего получилось что-то около 50 тысяч деклараций.

Задача технически была очень непростой, было написано множество парсеров под разные источники, тщательно структурировались данные по автомобилям, недвижимости и доходам. Для каждого гражданина и гражданки определялся автоматически определялся пол, идентифицировалось имущество, где оно находится и так далее. В общем получилось эдакая очень структурированная база данных из которой можно делать очень хитрые выборки. В виде этих выборок и есть множество отчетов на сайте которые Вы уже видите.

Главная проблема с которой мы столкнулись с тем что много некачественных данных — орфогрфических и порядковых ошибок в цифрах.

Проект делался по заказу ИНСОРа и вчера был озвучен во время представления их отчета по работе за 4 года. Собственно я бы на него не решился не имея какой-либо значимой институциональной поддержки, потому как тема деклараций очень чувствительная, а мы подошли к ней очень плотно дотянувшись до всех данных которых только можно было. Хотя и идея эта давно уже бродила в головах, но инициатив пока немного.

На этом же фоне сошлюсь на похожий проект у Трансперенси в России — http://declarator.org

Чем-то их проект лучше, чем-то лучше наш. У них больше данных с временной глубиной, у нас шире охват. У них лучше структуризация по ведомствам и регионам, у нас по структуре имущества и транспортными средствами. В общем много всего.

Понятно что проекту многого нехватает, в частности нет API, нет дампов данных, нет многих возможностей которые хотелось бы получить. Скорее всего все это появится

Если у Вас есть идеи, предложения и мысли что можно добавить/улучшить или пожелания по интеграции — пишите мне письмом или комментарием.

About This Author

Яндекс.Метрика