Мысли о приоритетах на 2014 год

Так сложилось что за этот год, и я лично, и вся наша команда и наше сообщество посвященное Открытым Знаниям проделали очень многое. И, в то же время, многое осталось незавершенным, недоделанным и не начатым. Не на всё хватило сил и ресурсов и многое хочется успеть с сделать в следующем году. А от многого, возможно, сознательно отказаться с целью не распылять свои силы.

Сообщество

Мы, наконец-то, активно занялись формированием сообщества вокруг темы открытых знаний и определением ключевых направлений которыми будем заниматься. На сайте «OKFN Россия» ru.okfn.org появляются последние новости именно сообщества и они будут далее пополняться. Недавно мы провели 1-ю встречу (meetup) в Москве и будем далее проводить их чаще. Подробности на странице встреч - www.meetup.com/okfnru/ Ближайшая встреча будет в январе посвящена открытым расходам (OpenSpending). Я призываю всех присоединяться и, конечно, самоорганизовываться всеми возможными способами.

Открытые данные

Открытые данные — это большая и важная тема для всех кто постоянно работает с данными и собирается делать это в будущем. За 2013 год в России произошёл перелом в институционализации открытых данных как части государственной политики. Нельзя сказать что всё что делали наши госорганы мне нравилось и нравится. Я, с некоторым содроганием жду открытия общероссийского портала data.gov.ru готовясь к худшему и не могу не обратить на появление многих государственных порталов.

Моя личная позиция по открытым данным в том что необходимо убеждать чиновников их открывать и делать это правильно, но ни на что не рассчитывать и готовиться к тому что, вполне возможно, данные придется как и раньше готовить самостоятельно. Для чего и существует наш хаб — hubofdata.ru на базе CKAN где мы неформально собираем массивы данных. Ничего официального, но всего очень много.

Понятное государство и понятный русский язык

Это две темы связанные между собой и всё несколько отличающиеся.

Понятность государства включает множество направлений:

  • понятность устройства государства 
  • понятность языка официальных документов;
  • понятность процедур того как работают внутригосударственные процессы

и многое другое. Эта понятность требует немалых усилий изнутри самого государства, особенно в части понятности процедур. А вот с понятностью языка официальных документов проще — её можно соотнести с понятностью языка в принципе. Это то что в англоязычных странах ранее называли Plain English, а теперь называют Plain Language. В мире существует множество государственных и частных инициатив по реорганизации официального языка и приведению его к понятным формам.

Есть в США проект PlainLanguage.gov, есть международная организация Clarity International и есть другие проекты.

Для того чтобы обеспечить понятность языка и понятность государства необходимо проделать очень многое. И одна из задач — это автоматизированная оценка понятности языка. В этом году, достаточно давно, я сделал первый прототип алгоритма определения читаемости текста в провязке к образованию читающего для русского языка. Но прототип — это еще не готовый алгоритм и проект. Чтобы заниматься чем-либо серьезно необходимо, либо достаточно ресурсов (внешнее финансирование), либо достаточно времени, либо понимание как это может быть монетизировано.

Понятный язык почти не монетизируем, большинство пропагандистов понятности языка в мире — это преподаватели языка, юристы перешедшие на светлую сторону силы и профессора лингвистики  . Я не знаю ни одного успешного бизнеса на его основе и практически все работы в этом направлении — это общественное благо в самом чистом виде. Поэтому эта тема пока еще в подвисшем состоянии, мы пытались получить на неё грант общественной палаты, но ничего не вышло.

Поэтому тема остаётся актуальной и в состоянии ожидания.

Цифровое сохранение 

Цифровое сохранение (Digital Preservation) — это инициатива по сохранению того цифрового содержания что человечество успел создать в электронной форме. Это документы, аудио-, видеозаписи и многочисленные другие файлы находящиеся в Интернете и на офлайновых носителях.
В мире существуют сотни проектов по консервации и архивации подобных данных. Самый известный проект — Интернет Архив (www.archive.org) включает не только краулер сайтов, но и огромные архивы цифрового наследия оцифрованные активистами по всему миру. Другие проекты включают сохранение старых игр, старых видеозаписей и фонограмм, веб-сайтов погибающих проектов и многое другое. 
Из системных проектов я особенно выделю международный консорциум по сохранению Интернета - netpreserve.org где разрабатывают стандарты архивации веб-сайтов.
И неформальный проект активистов ArchiveTeam которые сохраняют архивы гибнущих веб-проектов. Именно они за последние несколько лет успели сохранить несколько сотен террабайт из закрытых проектов MySpace, Yahoo и сервисов коротких ссылок и торрентов. 
В России эта тема пока еще развита очень слабо и вот только в этом году я лично занялся ей, отчасти вынужденно, поскольку ряд ресурсов которыми я интересовался много лет — внезапно и по разным причинам стали пропадать из сети. 
На сегодняшний день мне удалось сохранить несколько сотен веб-сайтов находившихся или находящихся на грани исчезновения. 
По по ссылке со списком коллекций архивов доступно описание каждого из архивов и есть возможность его выгрузки. А описание проекта есть на OpenGovData.ru - opengovdata.ru/projects/govarchive/ и на английском языке в github’е - https://github.com/infoculture/preserved-russia
Этот проект всё еще находится в процессе систематизации и структуризации. По нему нужно сделать очень многое — сделать сайт, систему автоматического запуска архивации, координацию волонтеров и многое другое. 
Это одно из тех направлений которым мы будем заниматься в следующем году. И здесь нужна помощь — волонтерская, дисковым пространством, программированием и многим другим. 
—-
То что я описал — это далеко не всё что будет в следующем году. А только некоторые важные приоритеты о которых никак нельзя забыть.
 

 

  • Silicon Pulse

    Добрый день, с кодировкой заголовков что-то не так …
    В остальном спасибо!
    Читаю Вас регулярно, производит впечатление :)

    • http://ivan.begtin.name Ivan Begtin

      Добрый день, а можете подробнее написать с какого браузера смотрите и какой язык там настроен?

      • Silicon Pulse

        вот, пожалуйста, характерно, что нигде в рунете с подобным не сталкивался, да, и у вас, кажется, впервые.

Яндекс.Метрика