Памятка по журналистике данных

Возможно, кто-то из Вас уже ранее слышал этот термин «журналистика данных» или «data driven journalism«. Если нет, то всячески рекомендую начать со статьи Евгении Шевниной в Mediapedia, заметку в блоге NewMediaLine — 10 фактов о журналистике данных, а также статью в блоге Сергея Рачинского —  Журналистика баз данных: Модный тренд или будущее профессии?

Итак.

Что же такое журналистика данных?

Журналистика данных — это совмещение журналистом роли переводчика с экономического/государственного/цифрового языка в язык понятный всем и, одновременно, роли аналитика представляющего материалы в предельно наглядной форме. Это могут быть списки, графики, интерактивные карты, специальные веб-компоненты которые позволяют отображать данные разными специальными способами и так далее.  Во всех случаях текст здесь является вспомогательным, а не основным инструментом. Эта особенность существенно меняет и форму подачи материалов. Информацию гораздо сложнее сделать эмоциональной, но и одновременно она куда более наглядна, поскольку один список или одна картинка, один график могут быть куда более наглядными чем тысячи слов.

Зачем это нужно?

Первая и ключевая причина — это наглядность подобного способа представления информации. Это позволяет охватить и удержать аудиторию которая не всегда готова вчитываться в большие тексты, но хорошо понимает их визуальное представление. Это одновременно, и упрощение подачи материалов, и усложнение процесса их подготовки. Журналистика данных — это новый тренд, явление которое сейчас проявляется в очень многих странах мира, в виде отдельных проектов крупных медиахолдингов и в виде личных датаблогов посвященных визуализации различной общественно значимой информации. Иначе говоря, для многих журналистов — это возможность получить признание и занять пока ещё пустующие ниши в медиапространстве. Учитывая что журналистика данных сейчас на подъеме и к не приходят все большее число СМИ, это может более чем востребовано в ближайшем будущем.

Пример: Guardian Datablog

В качестве заметного примера можно привести блог данных газеты Guardian в Великобритании. Этот блог, который можно назвать также отдельной редакторской колонкой, существует уже более 2-х лет, в нем опубликовано более 1000 постов на тему открытых данных, визуализации существующей информации, графики и списки сделанные редакцией и многое другое.

Это блог который и изначально вел один журналист Симон Роджерс (Simon Rodgers), а теперь туда пишет более 5 журналистов Guardian и пишут ежедневно, от 2-х до 4-х публикацией в сутки.

Из последних примеров — список заключенных Guantanomo и дефицит бюджета Великобритании

Пример: Los Angeles Times: Data Desk

У Los Angeles Times есть свой проект по данным который называется Data Desk. Это в меньшей степени работа журналистов и в большей степени редактора и команды программистов поскольку в Data Desk публикуются данные  и списки, они накладываются на карту Калифорнии или делаются в иной интерактивной форме. Фактически — это сервисы, над открытыми данными. В некоторых из них они берут информацию из существующих общественных проектов и сужают срезы только до Лос Анжелеса или до Калифорнии.

В чем сложности и ограничения

Главное ограничение — это необходимость навыков работы с рядом аналитических и технических инструментов. Это включает такие инструменты как Excel, Google Docs, IBM ManyEyes, Wordle и многие другие. Далеко не все журналисты обладают  навыками работы с этими инструментами и большинство из тех кто такими навыками обладают понимают то как необходимо подавать материалы в понятном медиа-формате.

Второе ограничение — это сравнительно невысокая доступность баз данных по России. У нас далеко не столь много общедоступной информации в структурированном виде чем в Великобритании или в США. У нас нет общероссийского государственного портала по открытым данным, нет специальных разделов с открытыми данными на сайтах органов власти и так далее. Зачастую даже если информация есть, её необходимо искать и преобразовывать.

Впрочем, на мой взгляд, это не неразрешимая задача. Данных у нас немало, особенно данных касающихся различных финансовых вопросов — бюджетов, индикаторов Центробанка и даже статистики по сдаче ЕГЭ.

Поэтому главное ограничение всё таки человеческое, чтобы вести темы в журналистике данных нужны заинтересованные в этой теме журналисты.

Как начать?

Я знаю что некоторые издания в России публикуют инфографику и результат анализа некоторых госданных, но, пока это происходит несистемно. Не в сфокусиронованном формате на открытые данные, на публичность государства, на понятность того что пишется.

Если Вы журналист, то задуматься и попробовать вести блог в формате журналистики данных. Предложить такой формат Вашей редакции. Вполне может быть что этот формат окажется востребованным аудиторией.

Если Вы редактор, то вполне возможно что журналистика данных — это именно то чего нехватает Вашему изданию и этот пост хорошая точка для старта.

Важно задать правильный формат изначально. Установить формат именно как журналистики данных, делать это в контексте открытых данных во всем мире.

С чего начать

В августе 2010 года в Европе прошла конференция по Data Driven Journalism и её отчет доступен онлайн http://mediapusher.eu/datadrivenjournalism/pdf/ddj_paper_final.pdf

В этом документе есть много примеров того как журналистика данных работает и используется по всему миру. Там же немало ссылок на инструменты которые журналист данных может использовать в своей работе.

А также существует немало инструментов доступных онлайн, я перечислю ключевые из них:

1. Google Docs — https://docs.google.com/

Сервис работы с документами и таблицами от Google. Помимо того что позволяет публиковать таблицы из Excel’я онлайн, для всеобщего доступа, там также есть возможность строить графики на основе этой информации.

2. Wordle — http://www.wordle.net

Wordle — это сервис по созданию «карт текста». Вы загружаете туда документ, а он подсчитывает частоту упоминаемости слов и наглядно отображает их в виде инфографики.

Пример визуализации ответов Медведева с его пресс-конференции я приводил совсем недавно.

3. IBM ManyEyes — http://www-958.ibm.com/software/data/cognos/manyeyes/

IBM ManyEyes — это сервис визуализации данных в форме различных графиков, наложения их на карты (мира или США) и построения ряда редких и наглядных графиков вроде Bubble Chart.

В 2010 году я публиковал бюджет Москвы на ManyEyes и скажу Вам что для визуализации сравнений — это бесподобный инструмент и не самый сложный.

Приложение. Ссылки

Каталоги открытых данных

Ссылки по визуализации

Инструменты, большая подборка

Руководства/Рекомендации

About This Author

Яндекс.Метрика