Задачки для тех у кого есть свободное время немного поработать над открытыми данными

Меня периодически спрашивают как можно помочь открытости данных и куда приложить свои силы.

Что делать тем кто хочет помогать человечеству с открытыми данными и не знает как?

Ответы на этот вопрос есть и их много. Я опишу самые очевидные и нужные шаги.

1. Преобразование существующих данных в HTML/PDF/DOC в открытые данные. 

Более 500 массивов данных у нас в хабе открытых данных доступны в формате HTML и только — http://hub.opengovdata.ru/dataset?res_format=HTML однако эти данные каталогизированы неслучайно. Каждый из Вас может взять любой из перечисленных там массивов, написать парсер для данных, и преобразовать данные в XML, CSV или другой удобный и полезный формат.

2. Сделать массив данных в RDF

Много данных у нас в России публикуется вот уже прямо сейчас в CSV и XML, однако данных в RDF почти совсем нет. Я знаю всего два таких массива данных — Каталог станций ВМО http://hub.opengovdata.ru/dataset/katajior-ctahunn-bmo  и онтология административного деления в OWL — http://hub.opengovdata.ru/dataset/adm-ontology

Пространство пусто и востребовано! Нужно больше данных в RDF/OWL, переход к Linked Data и интеграция в облако открытых связанных данных.

3. Преобразование данных в удобные форматы

Вот простая задачка. Администрация города Краснодара опубликовала кучу данных по городским объектам  — http://krd.ru/opendata/# однако данные все в CSV и XML форматах. Однако для удобства данные куда удобнее в гугловском KML формате или в Яндексовском YMapsML. Преобразование данных — это маленькая и несложная задачка — и полезная тоже.

4. Загрузка данных в хаб открытых данных

Мы постепенно стараемся все каталоги открытых данных затянуть в хаб — hub.opengovdata.ru, это не очень сложно, но охватили мы пока, понятное дело, не все.

Например, с московского портала данные извлекаются — https://github.com/infoculture/mosopendata

Вы можете нам тут существенно помочь. Сделав парсеры для:

— Краснодарского портала — http://krd.ru/opendata/

— Зеленоградского портала — http://data.zelao.ru

и всех остальных порталов перечисленных тут — http://hub.opengovdata.ru/group/catalogs

 

 

About This Author

Яндекс.Метрика