Не только открытые данные — некоммерческие проекты

За последние месяцы (годы?) мой блог и публичная деятельность стали плотно ассоциироваться с открытыми данными и, по этой причине, может иногда показаться что я и мои коллеги более ничем не занимаемся.

А это совсем не так, открытые данные — это важная тема, но далеко не единственная и мы занимаемся как ей, так и тем что может быть с помощью открытых данных создано и создается.

Вот лишь немногое из того что мы делаем и в каких направлениях работаем.

Digital Preservation: Цифровое сохранение

Интернету уже 20 лет, а компьютеры и программное обеспечение существуют не один десяток лет. За последние годы накопилось огромное количество цифровой информации — текстов, изображений, видео, баз данных и иного рода данных и кода. Многое из этого уже очень сложно просмотреть и оценить по множеству причин:

  • устаревание ПО и оборудования для работы с этой информацией (код для CP/M) банально не на чем запускать разьве что на симуляторах;
  • разрушение носителей информации;
  • отсутствие культуры долгосрочного хранения данных;

Из всех этих проблем есть одна на которую мы можем повлиять хотя бы отчасти — это отсутствие культуры долгосрочного хранения.

В частности:

  • огромное количество веб-сайтов уничтожается при разработке новой версии;
  • многие сайты и базы данных ликвидируются после расформирования организации/органа власти;
  • компании регулярно закрывают проекты и вся информация в них исчезает.

В целях чтобы это предотвратить существуют инициативы по «цифровому сохранению» (‘digital preservation‘). Эта инициатива предполагает обязательную архивацию веб-сайтов, существующих архивов и отдельных документов.

Чтобы понять что это такое обратите внимание на такие проекты:

  • DigitalPreservation.gov — портал цифрового наследия США.
  • Archive.org — огромный сетевой архив с копиями веб-сайтов, видеоматериалов.
  • UK Government Web Archive — архив всех государственных веб-сайтов органов власти Великобритании.
  • ArchiveTeam — неформальное сообщество цифровых архивистов спасающих погибающие сайты

И, наконец, моя инициатива — Консервированное государство (opengovdata.ru/projects/govarchive/). В этом проекте, на сегодняшний день, собрано более 100 погибающих государственных сайтов с общим объёмом около 30 гигабайт в архивированном виде и около 150 гигабайт в распакованном виде.

Пока это проект в состоянии «инкубации» — я сохраняю сам то до чего дотянутся руки и мне периодически помогают друзья и активисты кто сохраняет сайты также как и я. Все собранное доступно в открытом доступе.

Сейчас он всё еще технологически несовершенен. Пока еще приходится запускать архивацию вручную, нет системной регистрации метаданных цифровых объектов, получается сохранить только погибающие веб-сайты.

Понятный язык (Plain Language)

Не сомневаюсь что многие сталкивались с тем что слишком часты официальные тексты, тексты «условий использования», врачебные тексты и не только — написаны языком совершенно непонятным обычному человеку. При том что специалисты, обычно, понять этот текст могут. Эта разница в понимании возникает не только от разницы в образовании. Главная причина в отсутствии культуры говорить «понятным языком» — в отсутствии лучших практик, в отсутствии инструментов измерения понятности языка.

Для того чтобы преодолеть эти языковые барьеры вот уже много лет существуют такие инициативы как Plain English и Plain Language.

Я писал об этих движениях последние 2 года:

 

За прошедшее время эта тема никуда не делась, мы продолжаем над ней работать и думаем как можно запустить первые проекты. В этом году мы подавали две заявки на гранты Общественной Палаты и…, ожидаемо, ничего не получили.

Тематические проекты

Мы стараемся поддерживать постоянную активность вокруг не только открытых данных, но и открытости в принципе. Очень часто эти проекты пересекаются с другими нашими проектами и направлениями — с открытыми данными, краудсорсингом, понятностью и многим другим.

Какие-то проекты Вы знаете:

Открытая полиция (www.openpolice.ru) — проект по открытости и понятности полиции (правоохранительных органов) для людей

Перезапуск РосГосЗатрат — как вы понимаете из темы мониторинга государственных контрактов мы никуда не делись и идет создание проекта в котором мы соберём все контракты и дадим много полезных сервисов которых раньше не было. Очень скоро я напишу об этом подробнее.

Это всё, конечно, тоже не всё. Сомневаюсь что всё-всё я смогу описать когда-либо, но и этого достаточно чтобы занять себя на десятилетия.

Конечно же всех приглашаю помогать нам в этих проектах.

About This Author

  • Lisa

    Ну и суперсайт! Восторг) Вот я ищу сайт например, где даны открытые данные о бюджетах всех школ Москвы, знаю, что такой сайт есть и даже на какой -то лекции записывала его данные, но потеряла… Не твитнете ли Вы мне какую-нибудь наводочку) ?

Яндекс.Метрика