«Слепые данные» — анализ пробелов в данных Всемирного Банка

Если кто помнит, сравнительно недавно Всемирный банк открыл свой проект data.worldbank.org где они раскрывают значительные объёмы накопленных ими данных, особенно статистических и рейтинговых показателей и индикаторов. Кроме того они же организовали конкурс по созданию на базе этих данных Apps for Development (Приложений для развития). Инициатива хорошая и  интересная. И вот появляются результаты.

Некий разработчик Майкл Бенедикт создал проект BlindData (http://blinddata.org/) — Слепые данные. Проект весьма необычный, дело в том что вместо визуализации самой информации или её сложного анализа и выводов, вместо этого в проекте ищутся «слепые пятна», те места, участки в датасетах где должна была бы быть информация, но её нет.

Вот так он выглядит на практике.

И действительно, когда смотришь на некоторые индикаторы видно что иногда значение по нему есть, а иногда полностью отсутствует. И причин у этого может быть множество.

Одна причина — в том что далеко не все измерения велись с самого начала, например, данные о социальном развитии в основном собирались с начала 90-х.

Другая причина в невозможности получить информацию в ряде случаев в виду политической нестабильности, невозможности провести добросовестную оценку по данному индикатору и так далее.

И теперь, благодаря Blind Data, можно оценить насколько полны данные по тем или иным странам и темам.

Кстати, исходный код Blind Data доступен https://github.com/thebenedict/blinddata, а сам проект написан на Django.

А тем кто интересуется как в мире сейчас отрисовывают данные Всемирного Банка, советую заглянуть в галерею приложений Apps for Development — http://appsfordevelopment.challengepost.com/submissions там их уже почти 100 и многие весьма и весьма примечательны.

About This Author

  • pcmag_ru

    Самая изученная из крупных терри торий — Южная Америка, хм… Забавно.

Яндекс.Метрика