<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Иван Бегтин &#187; opensource</title>
	<atom:link href="http://ivan.begtin.name/category/opensource/feed/" rel="self" type="application/rss+xml" />
	<link>http://ivan.begtin.name</link>
	<description>Открытые данные, открытое государство</description>
	<lastBuildDate>Mon, 06 Feb 2012 14:32:43 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Памятка по журналистике данных</title>
		<link>http://ivan.begtin.name/2011/05/22/datajournalism/</link>
		<comments>http://ivan.begtin.name/2011/05/22/datajournalism/#comments</comments>
		<pubDate>Sun, 22 May 2011 09:22:02 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[blogging]]></category>
		<category><![CDATA[data.gov.ru]]></category>
		<category><![CDATA[datasets]]></category>
		<category><![CDATA[e-Government]]></category>
		<category><![CDATA[eGov]]></category>
		<category><![CDATA[opengovdata.ru]]></category>
		<category><![CDATA[opensource]]></category>
		<category><![CDATA[электронное государство]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=4363</guid>
		<description><![CDATA[<p>Возможно, кто-то из Вас уже ранее слышал этот термин &#171;журналистика данных&#187; или &#171;<a href="http://en.wikipedia.org/wiki/Data_driven_journalism">data driven journalism</a>&#171;. Если нет, то всячески рекомендую начать со <a href="http://mediapedia.ru/2010/08/11/zhurnalistka-dannyx-kak-guardian-prevratila-informacionnoe-syre-v-zolotuyu-zhilu/" target="_blank">статьи Евгении Шевниной</a> в Mediapedia, заметку в блоге NewMediaLine &#8212; <a href="http://newmedialine.blogspot.com/2011/05/10.html" target="_blank">10 фактов о журналистике данных</a>, а также статью в блоге Сергея Рачинского &#8212;  <a href="http://newmedia.in.ua/business/zhurnalistika-baz-dannyx-modnyj-trend-ili-budushhee-professii.html" target="_blank">Журналистика баз данных: Модный [...]]]></description>
			<content:encoded><![CDATA[<p>Возможно, кто-то из Вас уже ранее слышал этот термин &#171;журналистика данных&#187; или &#171;<a href="http://en.wikipedia.org/wiki/Data_driven_journalism">data driven journalism</a>&#171;. Если нет, то всячески рекомендую начать со <a href="http://mediapedia.ru/2010/08/11/zhurnalistka-dannyx-kak-guardian-prevratila-informacionnoe-syre-v-zolotuyu-zhilu/" target="_blank">статьи Евгении Шевниной</a> в Mediapedia, заметку в блоге NewMediaLine &#8212; <a href="http://newmedialine.blogspot.com/2011/05/10.html" target="_blank">10 фактов о журналистике данных</a>, а также статью в блоге Сергея Рачинского &#8212;  <a href="http://newmedia.in.ua/business/zhurnalistika-baz-dannyx-modnyj-trend-ili-budushhee-professii.html" target="_blank">Журналистика баз данных: Модный тренд или будущее профессии?</a></p>
<p>Итак.</p>
<h3><strong>Что же такое журналистика данных?</strong></h3>
<p>Журналистика данных &#8212; это совмещение журналистом роли переводчика с экономического/государственного/цифрового языка в язык понятный всем и, одновременно, роли аналитика представляющего материалы в предельно наглядной форме. Это могут быть списки, графики, интерактивные карты, специальные веб-компоненты которые позволяют отображать данные разными специальными способами и так далее.  Во всех случаях текст здесь является вспомогательным, а не основным инструментом. Эта особенность существенно меняет и форму подачи материалов. Информацию гораздо сложнее сделать эмоциональной, но и одновременно она куда более наглядна, поскольку один список или одна картинка, один график могут быть куда более наглядными чем тысячи слов.</p>
<h3><strong>Зачем это нужно?</strong></h3>
<p>Первая и ключевая причина &#8212; это наглядность подобного способа представления информации. Это позволяет охватить и удержать аудиторию которая не всегда готова вчитываться в большие тексты, но хорошо понимает их визуальное представление. Это одновременно, и упрощение подачи материалов, и усложнение процесса их подготовки. Журналистика данных &#8212; это новый тренд, явление которое сейчас проявляется в очень многих странах мира, в виде отдельных проектов крупных медиахолдингов и в виде личных датаблогов посвященных визуализации различной общественно значимой информации. Иначе говоря, для многих журналистов &#8212; это возможность получить признание и занять пока ещё пустующие ниши в медиапространстве. Учитывая что журналистика данных сейчас на подъеме и к не приходят все большее число СМИ, это может более чем востребовано в ближайшем будущем.</p>
<h3><strong>Пример: Guardian Datablog</strong></h3>
<p>В качестве заметного примера можно привести <a href="http://www.guardian.co.uk/news/datablog">блог данных </a>газеты Guardian в Великобритании. Этот блог, который можно назвать также отдельной редакторской колонкой, существует уже более 2-х лет, в нем опубликовано более 1000 постов на тему открытых данных, визуализации существующей информации, графики и списки сделанные редакцией и многое другое.</p>
<p>Это блог который и изначально вел один журналист Симон Роджерс (<a href="http://www.guardian.co.uk/profile/simonrogers">Simon Rodgers</a>), а теперь туда пишет более 5 журналистов Guardian и пишут ежедневно, от 2-х до 4-х публикацией в сутки.</p>
<p>Из последних примеров &#8212; <a href="http://www.guardian.co.uk/world/datablog/2011/apr/25/guantanamo-bay-detainees-full-list">список заключенных Guantanomo</a> и <a href="http://www.guardian.co.uk/news/datablog/2010/oct/18/deficit-debt-government-borrowing-data">дефицит бюджета Великобритании</a></p>
<h3><strong>Пример: Los Angeles Times: Data Desk </strong></h3>
<p>У Los Angeles Times есть свой проект по данным который называется <a href="http://projects.latimes.com/index/">Data Desk</a>. Это в меньшей степени работа журналистов и в большей степени редактора и команды программистов поскольку в Data Desk публикуются данные  и списки, они накладываются на карту Калифорнии или делаются в иной интерактивной форме. Фактически &#8212; это сервисы, над открытыми данными. В некоторых из них они берут информацию из существующих общественных проектов и сужают срезы только до Лос Анжелеса или до Калифорнии.</p>
<p><span id="more-4363"></span></p>
<h3><strong>В чем сложности и ограничения</strong></h3>
<p>Главное ограничение &#8212; это необходимость навыков работы с рядом аналитических и технических инструментов. Это включает такие инструменты как Excel, Google Docs, IBM ManyEyes, Wordle и многие другие. Далеко не все журналисты обладают  навыками работы с этими инструментами и большинство из тех кто такими навыками обладают понимают то как необходимо подавать материалы в понятном медиа-формате.</p>
<p>Второе ограничение &#8212; это сравнительно невысокая доступность баз данных по России. У нас далеко не столь много общедоступной информации в структурированном виде чем в Великобритании или в США. У нас нет общероссийского государственного портала по открытым данным, нет специальных разделов с открытыми данными на сайтах органов власти и так далее. Зачастую даже если информация есть, её необходимо искать и преобразовывать.</p>
<p>Впрочем, на мой взгляд, это не неразрешимая задача. Данных у нас немало, особенно данных касающихся различных финансовых вопросов &#8212; бюджетов, индикаторов Центробанка и даже статистики по сдаче ЕГЭ.</p>
<p>Поэтому главное ограничение всё таки человеческое, чтобы вести темы в журналистике данных нужны заинтересованные в этой теме журналисты.</p>
<h3>Как начать?</h3>
<p>Я знаю что некоторые издания в России публикуют инфографику и результат анализа некоторых госданных, но, пока это происходит несистемно. Не в сфокусиронованном формате на открытые данные, на публичность государства, на понятность того что пишется.</p>
<p>Если Вы журналист, то задуматься и попробовать вести блог в формате журналистики данных. Предложить такой формат Вашей редакции. Вполне может быть что этот формат окажется востребованным аудиторией.</p>
<p>Если Вы редактор, то вполне возможно что журналистика данных &#8212; это именно то чего нехватает Вашему изданию и этот пост хорошая точка для старта.</p>
<p>Важно задать правильный формат изначально. Установить формат именно как журналистики данных, делать это в контексте открытых данных во всем мире.</p>
<h3><strong>С чего начать</strong></h3>
<p>В августе 2010 года в Европе прошла конференция по Data Driven Journalism и её отчет доступен онлайн <a href="http://mediapusher.eu/datadrivenjournalism/pdf/ddj_paper_final.pdf">http://mediapusher.eu/datadrivenjournalism/pdf/ddj_paper_final.pdf</a></p>
<p>В этом документе есть много примеров того как журналистика данных работает и используется по всему миру. Там же немало ссылок на инструменты которые журналист данных может использовать в своей работе.</p>
<p>А также существует немало инструментов доступных онлайн, я перечислю ключевые из них:</p>
<p><strong> 1. Google Docs &#8212; <a href="https://docs.google.com/">https://docs.google.com/</a></strong></p>
<p>Сервис работы с документами и таблицами от Google. Помимо того что позволяет публиковать таблицы из Excel&#8217;я онлайн, для всеобщего доступа, там также есть возможность строить графики на основе этой информации.</p>
<p><strong>2. Wordle &#8212; <a href="http://www.wordle.net">http://www.wordle.net</a></strong></p>
<p>Wordle &#8212; это сервис по созданию &#171;карт текста&#187;. Вы загружаете туда документ, а он подсчитывает частоту упоминаемости слов и наглядно отображает их в виде инфографики.</p>
<p>Пример визуализации ответов Медведева с его пресс-конференции я<a href="http://ivan.begtin.name/2011/05/21/grizli/"> приводил совсем недавно</a>.</p>
<p><strong>3. IBM ManyEyes &#8212; <a href="http://www-958.ibm.com/software/data/cognos/manyeyes/">http://www-958.ibm.com/software/data/cognos/manyeyes/</a></strong></p>
<p>IBM ManyEyes &#8212; это сервис визуализации данных в форме различных графиков, наложения их на карты (мира или США) и построения ряда редких и наглядных графиков вроде Bubble Chart.</p>
<p>В 2010 году я публиковал <a href="http://ivbeg.livejournal.com/284398.html">бюджет Москвы на ManyEyes</a> и скажу Вам что для визуализации сравнений &#8212; это бесподобный инструмент и не самый сложный.</p>
<h3><strong>Приложение. Ссылки</strong></h3>
<p><strong>Каталоги открытых данных</strong></p>
<ul>
<li>OpenGovData.ru (Россия) &#8212; <a href="http://www.opengovdata.ru">http://www.opengovdata.ru</a></li>
<li>DataGov.ru (Россия) &#8212; <a href="http://www.datagov.ru">http://www.datagov.ru</a> (создан чтобы стать data.gov.ru)</li>
<li>Data.gov (US), <a href="http://www.data.gov/">http://www.data.gov/</a></li>
<li>Data.gov.uk (UK) <a href="http://data.gov.uk/">http://data.gov.uk/</a></li>
<li>Worldbank, Data <a href="http://data.worldbank.org/">http://data.worldbank.org/</a></li>
<li>Scraperwiki, <a href="http://scraperwiki.com/">http://scraperwiki.com/</a></li>
<li>Open Knowledge Foundation, <a href="http://okfn.org/">http://okfn.org/</a></li>
</ul>
<p><strong>Ссылки по визуализации</strong></p>
<p><strong> </strong></p>
<div id="_mcePaste">
<ul>
<li>Visual Complexity, <a href="http://www.visualcomplexity.com/vc/">http://www.visualcomplexity.com/vc/</a></li>
<li>Flowing Data,<a href=" http://flowingdata.com/"> http://flowingdata.com/</a></li>
<li>Well-formed Data, <a href="http://well-formed-data.net/">http://well-formed-data.net/</a></li>
<li>Information Aesthetics, <a href="http://infosthetics.com/">http://infosthetics.com/</a></li>
<li>Good Magazine, <a href="http://www.good.is/">http://www.good.is/</a></li>
<li>University of Amsterdam, <a href="http://www.digitalmethods.net/">http://www.digitalmethods.net/</a></li>
<li>Simple Complexity, <a href="http://simplecomplexity.net/">http://simplecomplexity.net/</a></li>
<li>A Beautiful WWW, <a href="http://abeautifulwww.com/">http://abeautifulwww.com/</a></li>
<li>Infografistas, <a href="http://infografistas.blogspot.com/">http://infografistas.blogspot.com/</a></li>
<li>Visual Editors, <a href="http://www.coolinfographics.com/">http://www.coolinfographics.com/</a></li>
<li>Cool Infographics, <a href="http://www.coolinfographics.com/">http://www.coolinfographics.com/</a></li>
<li>Datenjournalist. German blog on ddj. <a href="http://www.datenjournalist.de/">http://www.datenjournalist.de/</a></li>
</ul>
</div>
<p><strong>Инструменты, большая подборка</strong></p>
<ul>
<li>
<p style="display: inline !important;">Document Cloud, <a href="http://www.documentcloud.org/home">http://www.documentcloud.org/home </a></p>
</li>
<li>Google Code Playground: Helps to explore Google data and tools. <a href="http://code.google.com/apis/ajax/playground/">http://code.google.com/apis/ajax/playground/</a></li>
<li>
<p style="display: inline !important;">Zemanta, <a href="http://www.zemanta.com/">http://www.zemanta.com/</a></p>
</li>
<li>
<p style="display: inline !important;">Open Calais, <a href="http://www.opencalais.com/">http://www.opencalais.com/</a></p>
</li>
<li>API Playground &#8212; helping journalists to understand API Data. <a href="http://apiplayground.org/">http://apiplayground.org/</a></li>
<li>Gapminder Desktop, <a href="http://www.gapminder.org/desktop/">http://www.gapminder.org/desktop/</a></li>
<li>
<p style="display: inline !important;">Yahoo Pipes, <a href="http://pipes.yahoo.com/pipes/">http://pipes.yahoo.com/pipes/</a></p>
</li>
<li>
<p style="display: inline !important;">Tableau, <a href="http://www.tableausoftware.com/public/">http://www.tableausoftware.com/public/</a></p>
</li>
</ul>
<p><strong>Руководства/Рекомендации</strong></p>
<ul>
<li>OUseful.info, <a href="http://blog.ouseful.info/">http://blog.ouseful.info/</a></li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2011/05/22/datajournalism/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>О проектах по контролю за госрасходами в Мире</title>
		<link>http://ivan.begtin.name/2011/05/16/worldspending-2/</link>
		<comments>http://ivan.begtin.name/2011/05/16/worldspending-2/#comments</comments>
		<pubDate>Mon, 16 May 2011 07:40:45 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[data.gov.ru]]></category>
		<category><![CDATA[datasets]]></category>
		<category><![CDATA[e-Government]]></category>
		<category><![CDATA[eGov]]></category>
		<category><![CDATA[opengovdata.ru]]></category>
		<category><![CDATA[opensource]]></category>
		<category><![CDATA[госзаказ]]></category>
		<category><![CDATA[электронное государство]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/2011/05/16/worldspending-2/</guid>
		<description><![CDATA[<p>Примеры того как организации и граждане мониторят госзакупки/госрасходы/госконтракты в мире:</p> <p>Частные и некоммерческие проекты:</p> AidData (<a href="http://aiddata.org/">http://aiddata.org</a>) &#8212; собирают базу по всем расходам международных организаций и государств на поддержку и развитие других стран. Предоставляют все собранные данные в виде огромной базы с возможностью доступа через API, возможностью скачать все данные. Ранее этот проект существовал в [...]]]></description>
			<content:encoded><![CDATA[<p>Примеры того как организации и граждане мониторят госзакупки/госрасходы/госконтракты в мире:</p>
<p>Частные и некоммерческие проекты:</p>
<ul>
<li>AidData (<a href="http://aiddata.org/">http://aiddata.org</a>) &#8212; собирают базу по всем расходам международных организаций и государств на поддержку и развитие других стран. Предоставляют все собранные данные в виде огромной базы с возможностью доступа через API, возможностью скачать все данные. Ранее этот проект существовал в виде базы PLAID, также доступной у них на сайте. У проект сильная методология сведения очень разнородных данных и сейчас они реализуют важную и сложную задачу геокодирования мест помощи, отмечая их на картах стран где идут международные программы.</li>
<li>Where Does Our Money Go (<a href="http://wheredoesmymoneygo.org/">http://wheredoesmymoneygo.org/</a>) &#8212; проект Open Knowledge Foundation (<a href="http://www.okfn.org">http://www.okfn.org</a>), одного из наиболее заметных центров компетенции по открытым данным. В этом проекте собраны данных о бюджете Великобритании, Италии, Израиля, Германии и многих других стран. Много инфографики, в основном по Великобритании, и конечно доступность всего как открытых данных. А также материалы по их подходу к анализу госрасходов здесь &#8212; <a href="http://wiki.openspending.org/">http://wiki.openspending.org</a></li>
<li>ClearSpending (<a href="http://sunlightfoundation.com/clearspending/">http://sunlightfoundation.com/clearspending/</a>) проект Sunlight Labs, одного из сильнейших центров компетенции по открытости государства и открытым данным в США. Они пошли по пути анализа качества раскрываемых данных и произвели детальный анализ соответствия раскрываемых данных по госзаказу и бюджетам ведомств. У них качественно поставлена методология и визуализация устройства бюджетного процесса &#8212; <a href="http://sunlightfoundation.com/clearspending/animation/">http://sunlightfoundation.com/clearspending/animation/</a></li>
<li>zIndex (<a href="http://www.zindex.cz/">http://www.zindex.cz/</a>) &#8212; чешский проект активистов по мониторингу госзаказа. Они чем-то отдаленно похожи на Роспил.инфо, но без политического пиара. Каждый конкурс детально разбирается и преподается весьма детально и понятно. Почитайте его Wiki &#8212; <a href="http://wiki.zindex.cz/">http://wiki.zindex.cz</a> и все станет на свои места. Да, материалы там на чешском так что лучше воспользоваться сервисами вроде Google Translate.</li>
<li>FedSpending (<a href="http://www.fedspending.org/">http://www.fedspending.org/</a>) &#8212; проект по мониторингу госконтрактов в США. Один из первых подобных проектов в мире и именно он стал основой будущего правительственного проекта <a href="http://UsaSpending.gov">UsaSpending.gov</a></li>
<li>Disclosed.ca (<a href="http://www.disclosed.ca/">http://www.disclosed.ca/</a>) &#8212; канадский проект по агрегации всех госконтрактов. Не самый методологически проработанный, но работающий. Создан НКО &#8212; Visible Government, которые также отдают все данные как открытые данные (<a href="https://github.com/visiblegovernment">https://github.com/visiblegovernment</a>)</li>
<li>Government Expenses (<a href="http://www.governmentexpenses.ca/">http://www.governmentexpenses.ca/</a>) ещё один канадский проект визуализирующий бюджет. Тоже не забывают об открытых данных.</li>
<li>РосЗатраты (<a href="http://www.rosspending.ru">http://www.rosspending.ru</a>) &#8212; российский проект созданный по заказу ИНСОРа.</li>
</ul>
<p>Итого:</p>
<p>1. Всегда контроль госрасходов идет с акцентом на открытые данные. Их создание или их использование.</p>
<p>2. Главные акценты &#8212; доступность информации, разъяснения, сравнения, анализ.</p>
<p>3. Предельные выводы по перерасходу средств и другим нарушениям делаются только после детального анализа и публикации разъяснений. С обязательными оговорками что это предположения (пример, zIndex).</p>
<p>4. Ни один из проектов не является &#171;политическим&#187;, вокруг них вообще нет PR и серьёзного внимания СМИ.</p>
<p>А вот то чего нехватает в России в части публичного мониторинга госрасходов так это мониторинг за ФЦП и другими госпрограммами и визуализация бюджетов.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2011/05/16/worldspending-2/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Мониторинг радиации вокруг АЭС Фукусима и краудсорсинг</title>
		<link>http://ivan.begtin.name/2011/04/21/radcrowd/</link>
		<comments>http://ivan.begtin.name/2011/04/21/radcrowd/#comments</comments>
		<pubDate>Thu, 21 Apr 2011 04:54:31 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[e-Government]]></category>
		<category><![CDATA[eGov]]></category>
		<category><![CDATA[opengovdata.ru]]></category>
		<category><![CDATA[opensource]]></category>
		<category><![CDATA[электронное государство]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=4232</guid>
		<description><![CDATA[<p>Я продолжаю серию постов на ХабрХабр и на сей раз краткий обзор проектов по мониторингу радиации и краудсорсингу &#8212; <a href="http://habrahabr.ru/blogs/crowdsourcing/117870/">http://habrahabr.ru/blogs/crowdsourcing/117870/</a></p> <p>А некоторые подходы, вроде сервиса Pachube актуальны и у нас в России.</p> <p>P.S. Поскольку ХабраХабр открывается не у всех из-за проблем с их доменом, дубликую пост у себя в блоге целиком</p> <p>&#8212;<br /> Как [...]]]></description>
			<content:encoded><![CDATA[<p>Я продолжаю серию постов на ХабрХабр и на сей раз краткий обзор проектов по мониторингу радиации и краудсорсингу &#8212; <a href="http://habrahabr.ru/blogs/crowdsourcing/117870/">http://habrahabr.ru/blogs/crowdsourcing/117870/</a></p>
<p>А некоторые подходы, вроде сервиса Pachube актуальны и у нас в России.</p>
<p>P.S. Поскольку ХабраХабр открывается не у всех из-за проблем с их доменом, дубликую пост у себя в блоге целиком</p>
<p>&#8212;<br />
Как Вы знаете в Японии на АЭС Фукусима продолжается авария вызвавшая утечку радиации которая сейчас ликвидируется. Однако кроме сообщений новостных агентств, TEPCO и японских госструктур, граждане самоорганизуются и мониторят радиоактивную обстановку, а также извлекают официальные данные радиационного наблюдения и превращают их в наглядные проекты.<br />
Далее я рассмотрю несколько проектов активных прямо сейчас.<br />
<strong>1. Pachube</strong><br />
Дословно с их сайта:<br />
<em>Store, share &amp; discover realtime sensor, energy and environment data from objects, devices &amp; buildings around the world. Pachube is a convenient, secure &amp; scalable platform that helps you connect to &amp; build the &#8216;internet of things&#8217;.</em><br />
Фактически &#8212; это система различных сенсоров подключенных в Интернет и периодически публикующих различные показатели такие как: уровень радиации, потребление электричества и газа и многих других устройств. Это весьма мощный проект, с большим каталогом приложений, активно развивающийся и, в принципе, производящий впечатление.<br />
Выбрав раздел радиационных сенсоров &#8212; http://www.pachube.com/map/tags/sensor:type=radiation можно получить полный их список и, в частности, увидеть сенсоры в Японии вокруг реактора Фукусима.<br />
Ссылка &#8212; http://www.pachube.com<br />
Скриншот главной страницы:<br />
<img src="http://habrastorage.org/storage/efa27872/6e205f98/e1e41c0a/052349e1.jpg" alt="" /></p>
<p><strong>2. Japan Radiation Open Data</strong><br />
Мариан Штейнбах &#8212; информационный дизайнер из Германии вначале мониторила данные о радиации вручную, а потом создала скрипт которые скрейпит данные с сайтов ответственных японских ведомств и публикует их в форматах открытых данных, в виде CSV файлов.<br />
Ссылка &#8212; http://www.sendung.de/japan-radiation-open-data/<br />
Скриншот главной страницы блога:<br />
<img src="http://habrastorage.org/storage/ddcba3da/11c791c8/03df82d5/825424e5.jpg" alt="" /></p>
<p><span id="more-4232"></span></p>
<p><strong>3. GeigerCrowd</strong><br />
Этот проект с открытым исходным кодом с целью создать сеть мониторинга показаний измерителей радиации. Пока ещё результаты там не столь заметны как на других проектах, но доступность исходного кода позволяет использовать их наработки.<br />
Ссылка на сайт &#8212; http://geigercrowd.net/<br />
Репозиторий в GitHub &#8212; https://github.com/geigercrowd<br />
Скриншот главной страницы<br />
<img src="http://habrastorage.org/storage/519b1200/8bf825ec/e03c3163/565c43b0.jpg" alt="" /><br />
<strong>4. Radiation map (Crowdmap)</strong><br />
Карта радиации &#8212; это тематический проект в рамках сервиса <a href="http://www.crowdmap.com">Crowdmap</a> построенный на платформе Ушахиди<br />
Скриншот главной страницы:<br />
<img src="http://habrastorage.org/storage/6059d1f9/e0d0c8b4/20976aca/c25cb7aa.jpg" alt="" /><br />
<strong>5. RDTN.org</strong><br />
RDTN &#8212; это сейчас наиболее полный проект мониторинга радиоактивной обстановки. На карте они отображают краудсорсинговую информацию от граждан и показатели счетчиков, включая счетчики из Pachube.<br />
Ссылка &#8212; <a href="http://www.rdtn.org">http://www.rdtn.org</a><br />
Скриншот главной страницы:<br />
<img src="http://habrastorage.org/storage/56d000d0/3b64f04b/f43bf6c0/9ab0f865.jpg" alt="" /><br />
&#8212;-<br />
Особенно хочется отметить проекты Pachube и Crowdmap поскольку они уже являются не просто тематическими, а изначально настроены на высокую оперативность их создания. В Pachube достаточно добавлять новые сенсоры, а в Crowdmap сделать новый тематический проект через их интерфейс.<br />
Это значительно упрощает скорость реакции граждан на чрезвычайные происшествия.<br />
И, конечно, такие проекты приобретают большую ценность при наличии открытых государственных данных по мониторингу обстановки и при усилиях людей по преобразованию неудобных госданных в открытые данные, как это делает Мариан Штейнбах.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2011/04/21/radcrowd/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Про закупку открытого ПО Евросоюзом (на русском)</title>
		<link>http://ivan.begtin.name/2010/12/09/euopen/</link>
		<comments>http://ivan.begtin.name/2010/12/09/euopen/#comments</comments>
		<pubDate>Thu, 09 Dec 2010 12:32:21 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[e-Government]]></category>
		<category><![CDATA[eGov]]></category>
		<category><![CDATA[opensource]]></category>
		<category><![CDATA[электронное государство]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=3728</guid>
		<description><![CDATA[<p>На Хабрахабр появилась статья с переводом материалов по закупке открытого ПО Евросоюзом &#8212; <a href="http://habrahabr.ru/blogs/open_source/109681/">http://habrahabr.ru/blogs/open_source/109681/</a></p> <p>Я считаю что инициатива по переводу подобных программных документов &#8212; это правильно и автор проделал большую и важную работу.</p> <p>А скачать документ и его перевод можно по ссылке &#8212; <a href="http://www.box.net/shared/dza6hl87d4">http://www.box.net/shared/dza6hl87d4</a></p>]]></description>
			<content:encoded><![CDATA[<p>На Хабрахабр появилась статья с переводом материалов по закупке открытого ПО Евросоюзом &#8212; <a href="http://habrahabr.ru/blogs/open_source/109681/">http://habrahabr.ru/blogs/open_source/109681/</a></p>
<p>Я считаю что инициатива по переводу подобных программных документов &#8212; это правильно и автор проделал большую и важную работу.</p>
<p>А скачать документ и его перевод можно по ссылке &#8212; <a href="http://www.box.net/shared/dza6hl87d4">http://www.box.net/shared/dza6hl87d4</a></p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2010/12/09/euopen/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Про метаданные документов. Без примеров</title>
		<link>http://ivan.begtin.name/2010/12/08/metadata/</link>
		<comments>http://ivan.begtin.name/2010/12/08/metadata/#comments</comments>
		<pubDate>Wed, 08 Dec 2010 07:45:27 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[opensource]]></category>
		<category><![CDATA[алгоритмы]]></category>
		<category><![CDATA[аналитика]]></category>
		<category><![CDATA[информация]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=3701</guid>
		<description><![CDATA[<p>Последний раз про метаданные в офисных документах я писал более года назад в этой заметке &#171;<a href="http://ivan.begtin.name/2009/06/18/%D0%B8%D0%B7%D0%B2%D0%BB%D0%B5%D1%87%D0%B5%D0%BD%D0%B8%D0%B5-%D1%81%D0%BA%D1%80%D1%8B%D1%82%D1%8B%D1%85-%D0%BC%D0%B5%D1%82%D0%B0%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85-%D0%B8%D0%B7-%D0%B4%D0%BE%D0%BA/">Извлечение скрытых метаданных из документов MS Office</a>&#171;.</p> <p>Я какое-то время назад очень активно интересовался этой темой, в последнее время появилось много другого любопытного и метаданные документов отошли на второй план, однако в практических целях иногда знание того что и [...]]]></description>
			<content:encoded><![CDATA[<p>Последний раз про метаданные в офисных документах я писал более года назад в этой заметке &#171;<a href="http://ivan.begtin.name/2009/06/18/%D0%B8%D0%B7%D0%B2%D0%BB%D0%B5%D1%87%D0%B5%D0%BD%D0%B8%D0%B5-%D1%81%D0%BA%D1%80%D1%8B%D1%82%D1%8B%D1%85-%D0%BC%D0%B5%D1%82%D0%B0%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85-%D0%B8%D0%B7-%D0%B4%D0%BE%D0%BA/">Извлечение скрытых метаданных из документов MS Office</a>&#171;.</p>
<p>Я какое-то время назад очень активно интересовался этой темой, в последнее время появилось много другого любопытного и метаданные документов отошли на второй план, однако в практических целях иногда знание того что и как искать помогает.</p>
<p>Всех нюансов, конечно, не расскажешь, но кое что в дополнение и повторение к ранее написанному у меня есть. Единственно &#8212; примеров не будет. Те примеры что у меня сейчас на руках, могут оказаться не самые приятными для тех кто документы готовил. Так что примеры как-нибудь в другой раз.</p>
<p>Итак метаданные.</p>
<p>Если ранее я писал что есть два типа метаданных &#8212; метаданные документа и метаданные связанных объектов, то теперь вынужден признать что, на самом деле, метаданных куда больше.  Вернее даже не метаданных, а информации идентифицирующей автора и окружение.</p>
<p>Фактически я бы разделил эту идентификационную информацию на 4 типа:</p>
<p>- <strong>метаданные документа</strong> – свойства (properties)  документа которые обычно забывают удалить при сохранении и пересылке.</p>
<p>- <strong>метаданные вложенных объектов</strong> &#8212; свойства вложенных OLE объектов и изображений.</p>
<p>- <strong>маркеры</strong> &#8212; данные в гипертексте документа идентифицирующие его владельца.</p>
<p>- <strong>скрытые данные -</strong><strong> </strong>информация в участках документа недоступных для визуального просмотра.</p>
<p>Для каждого из типов идентификационной информации имеются свои ограничения доступности и характера содержимого.</p>
<p><strong>1. Метаданные документа</strong></p>
<p>Это свойства документа которые видны если открыть его &#171;Свойства&#187; в Эксплорере Windows или открыв в соответствующей программе MS Office. Про эти свойства, казалось бы, должны знать все и последние версии MS Office включают возможности удаления этих метаданных. Однако на практике это далеко не так. Часто метаданные забывают почистить и удалить и там можно увидеть &#171;чувствительную информацию&#187; о том кто был на самом деле автором документа,</p>
<p><strong>2. Метаданные вложенных объектов</strong></p>
<p>Об этом я писал в прошлой заметке и повторю сейчас. Вложенные объекты &#8212; это так называемые OLE объекты или контейнеры StructuredStorage содержащие другие документы/объекты с которыми умеет работать MS Office. Ещё вернее что объекты с которыми вообще умеет работать MS Windows, но в данном случае чуть упростим.</p>
<p>Если описать это ещё проще, то когда Вы готовите таблицу в Excel, а потом вставляете её в презентацию &#8212; это вставка OLE объекта. Точно также если вы делаете диаграмму в Visio и потом вставляете её в презентацию или документ &#8212; это вставка OLE объекта, если только вы не преобразовали вначале диаграмму в изображение.</p>
<p>Особенность этих вложенных объектов в том что каждый из них несёт свой собственный набор свойств заданных в той программе в которой данный объект создавался. Если Вы вложили таблицу Excel &#8212; значит у документа будут свойства которые указаны в Excel. Если объект Visio, то свойства заданные в Visio.</p>
<p>Коварство этой ситуации в том в что, что если Вы создаёте объект не в родной его программе, а через меню другой офисной программы через &#171;Вставить объект&#187;, то у Вас не будет возможности отредактировать свойства документа. А также если Вы работаете над документом вместе с кем-то и этот кто-то вставил объект, то в свойствах этого объекта будут метаданные с компьютера того пользователя и они там останутся.</p>
<p>Вложенные объекты можно извлечь несколькими способами, но большая часть из них весьма техническая и требует знаний того как устроены документы MS Office внутри, поэтому самый практичный способ &#8212; сохранить документ в одном из форматов OpenXML и распаковать его любимым ZIP распаковщиком. В результате, OLE объекты будут в папке embeddings. Впрочем  я ранее уже это описывал и заметке на которую я сослался вначале этого поста есть подробное описание процесса.</p>
<p>Однако, вложенными объектами могут быть не только OLE объекты. К этой же категории носителей информации можно отнести изображения. В изображениях может сохранятся информация EXIF (в JPEG файлах) и XMP. Подобное встречается гораздо реже, в основном если кто-то необдуманно вставляет в документы необработанные фотографии. Извлечь изображения можно по тому же рецепту &#8212; преобразовать в OpenXML, распаковать и заглянуть в папку media.</p>
<p><strong>3. &#171;Маркёры&#187;</strong></p>
<p>Это очень условное название для той информации которая может присутствовать в тексте документа и позволяет узнать более о его авторе. К подобной информации можно отнести:</p>
<p>- <strong>обсуждения и комментарии в режим правки</strong>. Иногда (в последнее время всё реже) авторы документов забывают про режим правки и публикуют документ со всей историей обсужения, заметками и так далее.</p>
<p>- <strong>ссылки</strong>. В некоторых случаях, сознательно или по ошибке в документах остаются ссылки на локальные документы того же пользователя или документы в его локальной сети. Чаще всего эти ссылки указывают на файлы на <strong>Desktop</strong> или же в папке &#171;<strong>Мои документы</strong>&#171;. Главное что такие ссылки позволяют узнать &#8212; локальное имя пользователя извлекаемой из пути к данному документу.</p>
<p><strong>4. Скрытые данные</strong></p>
<p>Кроме вполне очевидных данных (маркёров) в тексте есть некое количество данных которые скрыты в блоках бинарных файлов о предназначении которых можно знать или догадываться. Например, в Excel файлах есть специальный блок PLS содержащий информацию о принтерах.  Он содержит точно название модели принтера и его название и, скорее всего некую дополнительную информацию.</p>
<p>В некоторых случаях в скрытых данных присутствуют адреса файлов и пути которые могут быть интерпретированы так же как данные в ссылках, а то есть позволят извлечь информацию о локальном аккаунте пользователя.</p>
<p>А как собственно получить все эти данные?</p>
<p><strong> Инструменты</strong></p>
<p>Существует довольно большое число инструментов по работе с метаданными, но чего-то универсального не нет. Каждый из инструментов имеет свои плюсы и минусы и многие из них (но не все) описаны в статье <strong>Document Metadata Extraction </strong>в Forensics Wiki -<a href="http://www.forensicswiki.org/wiki/Document_Metadata_Extraction">http://www.forensicswiki.org/wiki/Document_Metadata_Extraction</a> здесь много ссылок на инструменты и библиотеки.</p>
<p>Набор инструментов:</p>
<p>- <strong>MS Office 2007-2010</strong> для преобразования из бинарных форматов MS Office в OpenXML. В данном случае OpenOffice не подойдёт поскольку он не сохраняет OLE объекты</p>
<p>- <strong>Strings -</strong><strong> </strong>утилитка из пакета Sysinternals позволяющая извлечь строковые переменные.</p>
<p>- <strong>OffVis</strong> &#8212; это такая специальная утилита от Microsoft позволяющая копатся в глубинах офисных документов. При глубоком анализе документов и выковыриванию PLS блоков из файлов Excel &#8212; незаменима. Скачать можно здесь <a href="http://download.techworld.com/3214034/microsoft-offvis-11/">http://download.techworld.com/3214034/microsoft-offvis-11/</a></p>
<p>- <strong>Metadata Extraction Tool</strong> &#8212; бесплатная утилитка по извлечению метаданных из офисных документов, PDF, изображений и так далее. заглядывает неглубоко и находит не всё  <a href="http://meta-extractor.sourceforge.net/">http://meta-extractor.sourceforge.net/</a></p>
<p>- <strong>Catalogue</strong> &#8212; собирает метаданные из разного типа файлов <a href="http://peccatte.karefil.com/software/Catalogue/CatalogueENG.htm">http://peccatte.karefil.com/software/Catalogue/CatalogueENG.htm</a></p>
<p><strong>- Metadata Analyzer &#8212; </strong>извлекает метаданные (только базовые)<strong> </strong><a href="http://smartpctools.com/metadata/">http://smartpctools.com/metadata/</a></p>
<p>- <strong>Document Trace Remover</strong> &#8212; убирает метаданные <a href="http://smartpctools.com/trace_remover/">http://smartpctools.com/trace_remover/</a></p>
<p>- <strong>Oracle Outside In </strong>- инструмент для разработчиков, поддерживает около 500 форматов файлов <a href="http://www.oracle.com/us/technologies/embedded/025613.htm">http://www.oracle.com/us/technologies/embedded/025613.htm</a></p>
<p>Это, конечно, совсем не предел тем вокруг извлечения информации. Есть также метаданные и способы их выковыривания из документов PDF и OpenOffice, электронных писем и так далее.</p>
<p>Кроме того есть масса нераскрытых возможностей связанных с неполным описанием бинарных проприетарных форматов.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2010/12/08/metadata/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Техническое: про регулярные выражения и Яндекс PIRE</title>
		<link>http://ivan.begtin.name/2010/11/11/%d1%82%d0%b5%d1%85%d0%bd%d0%b8%d1%87%d0%b5%d1%81%d0%ba%d0%be%d0%b5-%d0%bf%d1%80%d0%be-%d1%80%d0%b5%d0%b3%d1%83%d0%bb%d1%8f%d1%80%d0%bd%d1%8b%d0%b5-%d0%b2%d1%8b%d1%80%d0%b0%d0%b6%d0%b5%d0%bd%d0%b8/</link>
		<comments>http://ivan.begtin.name/2010/11/11/%d1%82%d0%b5%d1%85%d0%bd%d0%b8%d1%87%d0%b5%d1%81%d0%ba%d0%be%d0%b5-%d0%bf%d1%80%d0%be-%d1%80%d0%b5%d0%b3%d1%83%d0%bb%d1%8f%d1%80%d0%bd%d1%8b%d0%b5-%d0%b2%d1%8b%d1%80%d0%b0%d0%b6%d0%b5%d0%bd%d0%b8/#comments</comments>
		<pubDate>Thu, 11 Nov 2010 08:37:39 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[opensource]]></category>
		<category><![CDATA[алгоритмы]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=3583</guid>
		<description><![CDATA[<p>Что-то давно я не писал про технологии и алгоритмы.</p> <p>А тем временем, на днях, представители Яндекса выложили в открытый доступ ряд open source проектов &#8212; <a href="http://clubs.ya.ru/company/replies.xml?item_no=30753">http://clubs.ya.ru/company/replies.xml?item_no=30753</a></p> <p>Самый интересный из которых, на мой взгляд &#8212; это PIRE, <a href="https://github.com/dprokoptsev/pire">https://github.com/dprokoptsev/pire</a> Perl Incompatible Regular Expressions Library.</p> <p>Весьма интересная штука для тех кто когда либо прогонял через шаблоны [...]]]></description>
			<content:encoded><![CDATA[<p>Что-то давно я не писал про технологии и алгоритмы.</p>
<p>А тем временем, на днях, представители Яндекса выложили в открытый доступ ряд open source проектов &#8212; <a href="http://clubs.ya.ru/company/replies.xml?item_no=30753">http://clubs.ya.ru/company/replies.xml?item_no=30753</a></p>
<p>Самый интересный из которых, на мой взгляд &#8212; это PIRE, <a href="https://github.com/dprokoptsev/pire">https://github.com/dprokoptsev/pire</a> Perl Incompatible Regular Expressions Library.</p>
<p>Весьма интересная штука для тех кто когда либо прогонял через шаблоны большие объёмы текста/файлов/сетевого трафика и прочего файлового счастья.</p>
<p>Как я понимаю авторы обещают производительность до 400MB в секунду на &#171;common hardware&#187;, конечно, с кучей ограничений по тому что в регулярных выражениях может быть, но тем не менее &#8212; это быстро. Жаль там нет враппера для Питона, я бы попробовал на своих данных, благо их у меня накопилось много и есть с чем сравнивать. Пока поверю авторам на слово и исхожу из того что это так и есть, благо подход описанный у них в документации вполне понятен и должен работать.</p>
<p>Однако, жаль что подобных открытых разработок небыло хотя бы пары лет назад. Когда я разрабатывал Скиур &#8212; <a href="http://www.skyur.ru">http://www.skyur.ru</a> (это такой сервис по преобразованию веб-страниц в RSS), то решал задачи для которых как раз были необходимы такие инструменты  поскольку частью алгоритма является большое число тогда ещё регулярных выражений. В совокупности чуть менее 200, точно не скажу поскольку происходит их сборка из некого базового набора.</p>
<p>Но не имея таких инструментов я пошёл другим путём с решением &#171;в лоб&#187;, также оказавшего эффективным.</p>
<p>1. Все регулярные выражения были заменены на конечные автоматы</p>
<p>2. Собственно автоматы проанализированы и разбиты на повторяющиеся блоки.</p>
<p>3. Окончательная сборка шаблонов производится из группы базовых автоматов с добавлением к ним дополнительных блоков по набору правил.</p>
<p>4. На основе базовых шаблонов вручную формируется набор базовых правил заменяющих индекс. Фактически это замена для того же esmre для регулярных выражений. Которую, конечно, можно в дальнейшем автоматизировать.</p>
<p>То есть, фактически, это путь эффективен только в случае:</p>
<p>a.  Управляемости входного потока выражений.</p>
<p>б. Возможности разделения регулярные выражения на простые блоки и высокой повторяемости этих блоков.</p>
<p>Лично я нашёл что PyParsing - <a href="http://pyparsing.wikispaces.com/">http://pyparsing.wikispaces.com</a> при соблюдении описанных выше действий обеспечивает ускорение сравнения по сравнению с регулярными выражениями в разы. Собственно он и является весьма удобным конструктором.</p>
<p>Впрочем был бы PIRE или его аналог, пришлось бы гораздо проще. Впрочем и сейчас немало задач для которых такой инструмент необходим. Начиная от контроля сетевого трафика, задач из области поиска доказательств на компьютерах пользователей, классификационных задач, разбора различных полуструктурированных данных и так далее.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2010/11/11/%d1%82%d0%b5%d1%85%d0%bd%d0%b8%d1%87%d0%b5%d1%81%d0%ba%d0%be%d0%b5-%d0%bf%d1%80%d0%be-%d1%80%d0%b5%d0%b3%d1%83%d0%bb%d1%8f%d1%80%d0%bd%d1%8b%d0%b5-%d0%b2%d1%8b%d1%80%d0%b0%d0%b6%d0%b5%d0%bd%d0%b8/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Про новый формат Гугла &#8212; WebP</title>
		<link>http://ivan.begtin.name/2010/10/02/webp/</link>
		<comments>http://ivan.begtin.name/2010/10/02/webp/#comments</comments>
		<pubDate>Sat, 02 Oct 2010 14:40:07 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[opensource]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=3440</guid>
		<description><![CDATA[<p>На OpenNews.ru перевод статьи <a href="http://www.opennet.ru/opennews/art.shtml?num=28138">http://www.opennet.ru/opennews/art.shtml?num=28138</a> одного из разработчиков проекта x264 в котором ведётся разработка кодировщика для H.264</p> <p>Довольно подробный технический обзор плюсов и минусов с основным выводом в бессмысленности формата.</p> <p>А на мой личный взгляд вокруг бренда Гугла формируется слишком много сверхожиданий. До Гугла были и другие ИТ лидеры (IBM, Microsoft) у которых были [...]]]></description>
			<content:encoded><![CDATA[<p>На OpenNews.ru перевод статьи <a href="http://www.opennet.ru/opennews/art.shtml?num=28138">http://www.opennet.ru/opennews/art.shtml?num=28138</a> одного из разработчиков проекта x264 в котором ведётся разработка кодировщика для H.264</p>
<p>Довольно подробный технический обзор плюсов и минусов с основным выводом в бессмысленности формата.</p>
<p>А на мой личный взгляд вокруг бренда Гугла формируется слишком много сверхожиданий. До Гугла были и другие ИТ лидеры (IBM, Microsoft) у которых были как удачные идеи так и весьма от удачных далёкие.</p>
<p>Например, <a href="http://en.wikipedia.org/wiki/SPDY">SPDY</a> так и не получил никакого развития, впрочем <a href="http://ivan.begtin.name/2009/11/13/%D0%BF%D1%80%D0%BE-spdy-%D0%B8-%D1%83%D1%81%D0%BA%D0%BE%D1%80%D0%B5%D0%BD%D0%B8%D0%B5-web%D0%B0/">как я и предполагал</a>.</p>
<p>С этим форматом я также сомневаюсь в его значимости, однако здесь, подозреваю, цели не технологические, а сугубо практические &#8212; уменьшение трафика приходящегося на картинки. Даже если доля предположить что WebP подходит не для всех ситуаций, то даже если он будет использоваться в 10% картинок и даст экономию в 25% на каждую картинку &#8212; это уже 2.5% экономии. Может быть это и немного, а может быть и весьма существенно.</p>
<p>В любом случае многое будет зависеть от поддержки формата основными браузерами.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2010/10/02/webp/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Каким должен быть конкурс Apps for Russia и каким нет</title>
		<link>http://ivan.begtin.name/2010/09/21/howtodoitright/</link>
		<comments>http://ivan.begtin.name/2010/09/21/howtodoitright/#comments</comments>
		<pubDate>Tue, 21 Sep 2010 06:31:52 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[data.gov.ru]]></category>
		<category><![CDATA[e-Government]]></category>
		<category><![CDATA[eGov]]></category>
		<category><![CDATA[opengovdata.ru]]></category>
		<category><![CDATA[opensource]]></category>
		<category><![CDATA[электронное государство]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=3416</guid>
		<description><![CDATA[<p>Посмотрев подробнее на <a href="http://www.tvoystart.ru/">IT Прорыв</a>, я понял что раскритиковать его мало, надо описать сразу как такие проекты делать _правильно_. Разумеется, всё написанное далее моё сугубо личное мнение и ничего более. Которое, впрочем, стоит рассматривать как приглашение к активной дискуссии.</p> <p>Итак, недостатки ИТ прорыв.</p> <p>1. Партийный проект и политика</p> <p>Я лично с большим сомнением отношусь [...]]]></description>
			<content:encoded><![CDATA[<p>Посмотрев подробнее на <a href="http://www.tvoystart.ru/">IT Прорыв</a>, я понял что раскритиковать его мало, надо описать сразу как такие проекты делать _<strong>правильно</strong>_. Разумеется, всё написанное далее моё сугубо личное мнение и ничего более. Которое, впрочем, стоит рассматривать как приглашение к активной дискуссии.</p>
<p>Итак, недостатки ИТ прорыв.</p>
<p><strong>1. Партийный проект и политика</strong></p>
<p>Я лично с большим сомнением отношусь к деятельности вообще любых партий и к пониманию их руководством вопросов координации гражданской активности и технологий. Но главное что партийность у подобного проекта идёт наперекор всей мировой практике. В мире подобного рода инициативы исходят, либо от госструктур, либо, что чаще, от близких к ним некоммерческих организаций, но уж точно не от партий. И причины этого понятны &#8212; такой проект в лучшем случае соберёт участников той партии которая его запустила и точно не соберёт тех кому эта партия неинтересна. Конкретно &#171;Единая России&#187; ранее в своих инициативах в техническом и технологическом креативе замечена не была. Схожий проект &#8212; &#171;Зворыкинский проект&#187; (<a href="http://zv.innovaterussia.ru/">http://zv.innovaterussia.ru/</a>) имеет государственный статус, четкие направления, понятные цели и интересный список проектов &#8212; <a href="http://zv.innovaterussia.ru/projects/list">http://zv.innovaterussia.ru/projects/list</a>. Я готов поверить в то что и там не всё идеально, но то что это гораздо лучше чем ИТ Прорыв &#8212; это не подлежит сомнению.</p>
<p>Кроме того партийность проекта влияет на то как воспринимается его критика и перенос этой критики на партию. Вот мне, честно говоря, партия безразлична настолько насколько это только возможно, но критикуя проект всё равно мимо неё пройти не получается.</p>
<p><strong>2. Странный выбор названия и домена</strong></p>
<p>Проект называется IT Прорыв, а домен tvoystart.ru . Это весьма странно и остаётся ощущение что идея у инициаторов недозрела раз пришлось менять название на ходу.  Выглядит несерьёзно.</p>
<p><strong>3. Недостаточная сфокусированность и нечёткое целеполагание</strong></p>
<p>Есть целый ряд очень важных и ключевых тем которые можно было бы раскрыть и раскрыть очень хорошо, но они в проекте даже не обозначены. Кроме того нет ещё одного важного фокуса &#8212; общественное благо. Потому как, по сути, все идеи можно разделить по двум категориям. Нацеленные на извлечение прибыли и на создание общественного блага &#8212; в пределах своего населённого пункта, региона или страны целиком.</p>
<p>В этом плане зворыкинский проект хорошо понятен &#8212; там акцент на построении бизнеса на основе инноваций, и это вполне себе хорошая идеология.  Здесь же более подходит идеология &#171;общественного блага&#187; идеи из которых могут применятся и в бизнесе, но бизнес не должен быть ключевым, а главное &#8212; это польза для общества.</p>
<p>Например, те же Ростехнологии могли бы поднять на флагшток темы и идеи использования ГЛОНАСС (да и GPS) . Логично здесь смотрелись бы и темы энергоэффективности, использования суперкомпьютеров, сохранение культурного наследия и так далее.</p>
<p>Лично я считаю что ИТ само по себе не может быть отдельной темой. Это мощный инструмент помощи в других вопросах.</p>
<p><strong>4. Отсутствие модерации</strong></p>
<p><strong><span style="font-weight: normal;">Если бы была модерация, то небыло бы такого <a href="http://www.tvoystart.ru/work/?ELEMENT_ID=7084">http://www.tvoystart.ru/work/?ELEMENT_ID=7084</a><strong> </strong>или решения личных вопросов &#8212; <a href="http://www.tvoystart.ru/work/?ELEMENT_ID=6480">http://www.tvoystart.ru/work/?ELEMENT_ID=6480</a> или такое <a href="http://www.tvoystart.ru/work/?ELEMENT_ID=557">http://www.tvoystart.ru/work/?ELEMENT_ID=557</a></span></strong></p>
<p><strong><span style="font-weight: normal;">А вот чудо про чип в большом пальце с рождения реагирующий на матерные слова стоит почитать обязательно &#8212; <a href="http://www.tvoystart.ru/work/?ELEMENT_ID=8045">http://www.tvoystart.ru/work/?ELEMENT_ID=8045</a>. Креатив! </span></strong></p>
<p><strong>5. Недетские проекты от школьников</strong></p>
<p>Стоит посмотреть на &#171;Формирование электронного правительства детей Орловской области&#187; &#8212; <a href="http://www.tvoystart.ru/work/?ELEMENT_ID=1368">http://www.tvoystart.ru/work/?ELEMENT_ID=1368</a> мог ли такой текст написать школьник?</p>
<p>Или проект Антитеррор+ <a href="http://www.tvoystart.ru/work/?ELEMENT_ID=2175">http://www.tvoystart.ru/work/?ELEMENT_ID=2175</a> В самом деле школьники оперируют понятиями &#171;модуль&#187; системы и разработкой ТЗ? Может тогда и сразу по ГОСТу 19 и 34, чего мелочиться то.</p>
<p><strong>6. Смешение несмешиваемого</strong></p>
<p><strong><span style="font-weight: normal;">Я не могу понять зачем было смешивать обычные конкурсы рисунков (<a href="http://www.tvoystart.ru/works-catalogue/?nomination=4743">http://www.tvoystart.ru/works-catalogue/?nomination=4743</a>) и эссе о технологиях (<a href="http://www.tvoystart.ru/works-catalogue/?nomination=4744">http://www.tvoystart.ru/works-catalogue/?nomination=4744</a>) с проектами по &#171;Электронной России&#187; (<a href="http://www.tvoystart.ru/works-catalogue/?nomination=4104">http://www.tvoystart.ru/works-catalogue/?nomination=4104</a>). </span></strong></p>
<p><strong><span style="font-weight: normal;">&#8212;</span></strong></p>
<p><strong><span style="font-weight: normal;">И так далее. Там ещё много всего наберётся, однако это всё будет не более чем внешние признаки изначально неправильного подхода. Вместо жёсткого отсева идей и проектов и отбора лучших и активных идёт целый ряд конкурсов на которые может подасться кто угодно.</span></strong></p>
<p><strong><span style="font-weight: normal;">Есть вопросы и к организации. На сейте нет ни указания какая именно организация его ведёт, ни подробного описания, ни &#171;лица проекта&#187;. Сравните его с Code For America (<a href="http://codeforamerica.org/">http://codeforamerica.org/</a>) где на главной странице выступление Тима О&#8217;Релли, а сам проект идёт от одноимённой некоммерческой организации под этот проект созданной.</span></strong></p>
<p><strong><span style="font-weight: normal;">Ключевой вопрос &#8212; а как же делать правильно? </span></strong></p>
<p><strong><span style="font-weight: normal;">Я считаю что есть несколько подходов основывающихся на одном единственном принципе &#8212; общественном благе.</span></strong></p>
<p>Во первых проект должен идти от одной или нескольких некоммерческих организаций или госструктуры. Например, проект могли бы инициировать такие учреждений как <a href="http://www.iis.ru">ИРИО</a> или <a href="http://www.insor-russia.ru">ИНСОР</a> или же иной некоммерческой организацией которая бы устанавливала правила и призовой фонд для участников. Такой организацией также может выступать какая-либо отраслевая ассоциация.</p>
<p>Почему так? Потому как крупные ИТ компании, как правило, в одной лодке плыть не любят. Если в проекте участвует Microsoft, значит Google там не будет. Если будет Яндекс, значит там не будет Mail.ru и так далее.</p>
<p>Во вторых проект должен быть очёнь чётко направленным. На первом этапе необходим отбор тем, на втором отбор проектов. В зависимости от тем и определяются партнёры-участники проекта от каждого из которых выступает один или несколько лиц кураторов темы ответственных за отбор проектов среди всех заявок.</p>
<p>В третьих &#8212; это акцент на открытом исходном коде. Не в концепции СПО где открытый исходный код у базовых продуктов &#8212; ОС, подготовка документов и так далее. А в концепции &#171;общественного блага&#187;. Разработанные участниками конкурса проекты должны быть доступны с исходным кодом и возможностью для других их использовать</p>
<p><strong><span style="font-weight: normal;">В четвёртых необходимо чётко развести сбор идей и проекты с практическими результатами. И те и другие необходимо представлять в виде структурированного описания. Не так как это сейчас сделано в проекте IT прорыв, а то как это работает в проекте <a href="http://www.startupindex.ru">StartupIndex.ru</a>. В принципе, проект StartupIndex &#8212; это хороший пример такого подхода для коммерческих проектов. И в партнёрстве с ним или же на основе схожей идеологии может строиться и Apps For Russia с тем лишь отличием что первой строкой в нём идёт всё то же </span><span style="font-weight: normal;">общественное благо <span style="font-weight: normal;">и лишь дополнением является возможность коммерческого использования.</span></span></strong></p>
<p>В пятых такой проект может идти в рамках госполитики, но не в рамках политики как деятельности партий поскольку целью его должно быть политически нейтральная поддержка наиболее активных.</p>
<p>В шестых фундаментом Apps For Russia должна быть одна базовая идея &#8212; открытые данные. Этот фундамент используется сейчас в большинстве таких проектов в мире и уже сейчас в OpenGovData.ru накоплено достаточно данных для того чтобы такой проект запускать.</p>
<p><strong><span style="font-weight: normal;"><br />
</span></strong></p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2010/09/21/howtodoitright/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>Civic Commons</title>
		<link>http://ivan.begtin.name/2010/09/10/civiccommons/</link>
		<comments>http://ivan.begtin.name/2010/09/10/civiccommons/#comments</comments>
		<pubDate>Fri, 10 Sep 2010 11:05:48 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[e-Government]]></category>
		<category><![CDATA[eGov]]></category>
		<category><![CDATA[opensource]]></category>
		<category><![CDATA[электронное государство]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=3372</guid>
		<description><![CDATA[<p>У <a href="http://gov-gov.ru/?p=1869">Катерины появился пост</a> про Civic Commons (<a href="http://civiccommons.com/">http://civiccommons.com/</a>) проект появившийся как результат <a href="http://codeforamerica.org/">Code for America</a>. В нём собраны многочисленные некоммерческие приложения с открытым кодом которыми могут воспользоваться госструктуры в построении решений и сервисов для граждан.</p> <p>В некотором смысле это опенсорсный аналог <a href="https://apps.gov/">apps.gov</a> где собрано коммерческое ПО и сервисы полезные для госорганов [...]]]></description>
			<content:encoded><![CDATA[<p>У <a href="http://gov-gov.ru/?p=1869">Катерины появился пост</a> про Civic Commons (<a href="http://civiccommons.com/">http://civiccommons.com/</a>) проект появившийся как результат <a href="http://codeforamerica.org/">Code for America</a>. В нём собраны многочисленные некоммерческие приложения с открытым кодом которыми могут воспользоваться госструктуры в построении решений и сервисов для граждан.</p>
<p>В некотором смысле это опенсорсный аналог <a href="https://apps.gov/">apps.gov</a> где собрано коммерческое ПО и сервисы полезные для госорганов в США.</p>
<p>Какая здесь польза для нас? А их две. Во первых &#8212; это кейс и пример того что Code for America успешен, во вторых сама идея весьма разумна и в России вполне мог бы появится свой Civic Commons.</p>
<p>P.S. В последние дни Катерина (<a href="http://www.gov-gov.ru">gov-gov.ru</a>) и Алёна Попова (<a href="http://www.alenapopova.ru/">http://www.alenapopova.ru/</a>)  меня явно обгоняют по публикации разного вкусного и интересного по мировому и российскому e-Gov. Что впрочем не значит что я я не затаился со стратегическим запасом новостей  и только жду повода;)</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2010/09/10/civiccommons/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Новое в OpenGovData.ru &#8212; данные, заметки, источники и примеры</title>
		<link>http://ivan.begtin.name/2010/08/28/newdata/</link>
		<comments>http://ivan.begtin.name/2010/08/28/newdata/#comments</comments>
		<pubDate>Sat, 28 Aug 2010 20:23:01 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[data.gov.ru]]></category>
		<category><![CDATA[datasets]]></category>
		<category><![CDATA[e-Government]]></category>
		<category><![CDATA[eGov]]></category>
		<category><![CDATA[opengovdata.ru]]></category>
		<category><![CDATA[opensource]]></category>
		<category><![CDATA[электронное государство]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=3346</guid>
		<description><![CDATA[<p>Итак, в <a href="http://www.opengovdata.ru">OpenGovData.ru</a> и его <a href="http://opengovdataru.pbworks.com">Вики</a> появилось много нового.</p> <p>1. За 4 дня было было создано 14 парсеров и, соответственно, у нас появилось 14 новых массивов машиночитаемых данных. Почти все были сделаны волонтёрами по своей инициативе. Я считаю что это очень круто и мы вместе делаем очень важное дело. Пусть и по маленьким [...]]]></description>
			<content:encoded><![CDATA[<p>Итак, в <a href="http://www.opengovdata.ru">OpenGovData.ru</a> и его <a href="http://opengovdataru.pbworks.com">Вики</a> появилось много нового.</p>
<p>1. За 4 дня было было создано 14 парсеров и, соответственно, у нас появилось 14 новых массивов машиночитаемых данных. Почти все были сделаны волонтёрами по своей инициативе. Я считаю что это очень круто и мы вместе делаем очень важное дело. Пусть и по маленьким кусочкам, но, свершилось главное идея создания машиночитаемых данных своими руками &#8212; работает.</p>
<p>Кстати, предлагаю всем подумать над тем как можно проанализировать и что можно из этих данных интересное сделать. Например, я лично уже копаюсь в реестре недобросовестных поставщиков, а кому могут быть интересны данные государственного регистра фильмов, базы запуска космических аппаратов или сводной налоговой отчетности. Предлагаю всем заглянуть в то что у нас уже есть тут <a href="http://opengovdataru.pbworks.com/%D0%9A%D0%B0%D0%BA-%D0%BF%D0%BE%D0%BC%D0%BE%D1%87%D1%8C-%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%D1%83">в вики</a> и в <a href="http://opengovdata.ru/opendata/">списках массивов данных</a>.</p>
<p>2. В список источников opengovdata.ru я добавил ещё 10 новых. Их можно просмотреть <a href="http://opengovdata.ru/sources/">в списке тут</a> в основном это статистика ФСИН, МЧС и МВД. Присылайте новые мне или вносите в список <a href="http://opengovdataru.pbworks.com/%D0%98%D1%81%D1%82%D0%BE%D1%87%D0%BD%D0%B8%D0%BA%D0%B8-%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85">в вики проекта тут</a></p>
<p>3. В разделе <a href="http://opengovdataru.pbworks.com/%D0%A0%D0%B5%D1%86%D0%B5%D0%BF%D1%82%D1%8B,-%D1%81%D0%BE%D0%B2%D0%B5%D1%82%D1%8B-%D0%B8-%D1%80%D0%B5%D0%BA%D0%BE%D0%BC%D0%B5%D0%BD%D0%B4%D0%B0%D1%86%D0%B8%D0%B8">рецепты и инструменты</a> добавились ссылки на примеры кода, фреймворки и движки по извлечению данных, их обработке и визуализации. Постепенно там будет собрана максимально обширная коллекция материалов. Если Вы видите что там чего-то нехватает, смело добавляйте или пишите мне &#8212; я добавлю.</p>
<p>4. Я начал вносить в Вики собственные парсеры накопленные мною за время работы над opengovdata.ru. Сейчас на странице <a href="http://opengovdataru.pbworks.com/%D0%9A%D0%B0%D0%BA-%D0%BF%D0%BE%D0%BC%D0%BE%D1%87%D1%8C-%D0%BF%D1%80%D0%BE%D0%B5%D0%BA%D1%82%D1%83">со списком преобразованных данных</a> я выложил парсер списка сайтов кредитных организаций (банков) с сайта Банка России.</p>
<p>А также вот тут <a href="http://gist.github.com/555510">http://gist.github.com/555510</a> можно посмотреть пример кода как автоматизировать извлечение очень простых таблиц с веб-страниц и примеры того как этот код помог в сборе данных о грантах для <a href="http://www.rosspending.ru">РосГосЗатрат</a>.  Фактически всё что нужно для простых таблиц &#8212; это ссылка, кодировка страницы и код xpath, как правило, очень простой.</p>
<p>&#8212;</p>
<p>Тем временем, пока мы вместо наших госорганов делаем данные открытыми и публичными, норвежские чиновники вот тут <a href="http://data.norge.no/blogg/2010/08/en-klausulbuffet-av-vilkar/">http://data.norge.no/blogg/2010/08/en-klausulbuffet-av-vilkar/</a> обсуждают вопросы лицензирования открытых данных отдавая предпочтение лицензии Creative Commons. Страница неплохо переводится на русский через Google Translate или же, разъяснения на английском, есть на <a href="http://www.epsiplus.net/news/news/norway_discusses_licensing_model">общеевропейском портале</a>.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2010/08/28/newdata/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>

