<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Иван Бегтин &#187; поиск</title>
	<atom:link href="http://ivan.begtin.name/category/poisk/feed/" rel="self" type="application/rss+xml" />
	<link>http://ivan.begtin.name</link>
	<description>Открытые данные, открытое государство</description>
	<lastBuildDate>Mon, 06 Feb 2012 14:32:43 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>Автоматическое индексирование отсканированных документов</title>
		<link>http://ivan.begtin.name/2009/08/26/%d0%b0%d0%b2%d1%82%d0%be%d0%bc%d0%b0%d1%82%d0%b8%d1%87%d0%b5%d1%81%d0%ba%d0%be%d0%b5-%d0%b8%d0%bd%d0%b4%d0%b5%d0%ba%d1%81%d0%b8%d1%80%d0%be%d0%b2%d0%b0%d0%bd%d0%b8%d0%b5-%d0%be%d1%82%d1%81%d0%ba%d0%b0/</link>
		<comments>http://ivan.begtin.name/2009/08/26/%d0%b0%d0%b2%d1%82%d0%be%d0%bc%d0%b0%d1%82%d0%b8%d1%87%d0%b5%d1%81%d0%ba%d0%be%d0%b5-%d0%b8%d0%bd%d0%b4%d0%b5%d0%ba%d1%81%d0%b8%d1%80%d0%be%d0%b2%d0%b0%d0%bd%d0%b8%d0%b5-%d0%be%d1%82%d1%81%d0%ba%d0%b0/#comments</comments>
		<pubDate>Wed, 26 Aug 2009 14:01:16 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[google]]></category>
		<category><![CDATA[информация]]></category>
		<category><![CDATA[поиск]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=2128</guid>
		<description><![CDATA[<p>Сегодня обнаружил интересное явление. Оказывается Гугл научился автоматически индексировать PDF файлы содержащие отсканированные страницы документов. Соответственно эти документы теперь находятся через поиск.</p> <p>Например, вот такой документ МинЭкономРазвития (<a href="http://www.economy.gov.ru/wps/wcm/connect/economylib/mert/resources/0483b980494845219e3cbf2ff0d17d30/49.pdf">ссылка на документ со сканами страниц</a>) можно найти через поиск &#8212; например, <a href="http://www.google.ru/search?hl=ru&#38;safe=off&#38;rlz=1C1_____enRU327RU327&#38;newwindow=1&#38;q=О+создании+межведомственной+рабочей+группы+по+организации+работы+по+разработке+и+утверждению+региональных+программ+развития+конкуренции+на+продовольственных+рынках+site:economy.gov.ru&#38;btnG=Поиск&#38;lr=lang_ru&#38;aq=f&#38;oq=">вот так</a> и щелкнув на ссылку &#171;просмотреть&#187; переходим в Google Docs где ещё одним [...]]]></description>
			<content:encoded><![CDATA[<p>Сегодня обнаружил интересное явление. Оказывается Гугл научился автоматически индексировать PDF файлы содержащие отсканированные страницы документов. Соответственно эти документы теперь находятся через поиск.</p>
<p>Например, вот такой документ МинЭкономРазвития (<a href="http://www.economy.gov.ru/wps/wcm/connect/economylib/mert/resources/0483b980494845219e3cbf2ff0d17d30/49.pdf">ссылка на документ со сканами страниц</a>) можно найти через поиск &#8212; например, <a href="http://www.google.ru/search?hl=ru&amp;safe=off&amp;rlz=1C1_____enRU327RU327&amp;newwindow=1&amp;q=О+создании+межведомственной+рабочей+группы+по+организации+работы+по+разработке+и+утверждению+региональных+программ+развития+конкуренции+на+продовольственных+рынках+site:economy.gov.ru&amp;btnG=Поиск&amp;lr=lang_ru&amp;aq=f&amp;oq=">вот так</a> и щелкнув на ссылку &#171;просмотреть&#187; переходим в Google Docs где ещё одним щелчком на &#171;Обычный формат HTML&#187; документ возвращается в виде текста.</p>
<p>В общем, Google нашли себе ещё один большой срез данных. Осталось лишь дождаться когда поисковик начнет заглядывать в архивы, распознавать текст и объекты на картинках и так далее.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2009/08/26/%d0%b0%d0%b2%d1%82%d0%be%d0%bc%d0%b0%d1%82%d0%b8%d1%87%d0%b5%d1%81%d0%ba%d0%be%d0%b5-%d0%b8%d0%bd%d0%b4%d0%b5%d0%ba%d1%81%d0%b8%d1%80%d0%be%d0%b2%d0%b0%d0%bd%d0%b8%d0%b5-%d0%be%d1%82%d1%81%d0%ba%d0%b0/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Информационная архитектура наоборот и анализ форм</title>
		<link>http://ivan.begtin.name/2009/04/08/%d0%b8%d0%bd%d1%84%d0%be%d1%80%d0%bc%d0%b0%d1%86%d0%b8%d0%be%d0%bd%d0%bd%d0%b0%d1%8f-%d0%b0%d1%80%d1%85%d0%b8%d1%82%d0%b5%d0%ba%d1%82%d1%83%d1%80%d0%b0-%d0%bd%d0%b0%d0%be%d0%b1%d0%be%d1%80%d0%be%d1%82/</link>
		<comments>http://ivan.begtin.name/2009/04/08/%d0%b8%d0%bd%d1%84%d0%be%d1%80%d0%bc%d0%b0%d1%86%d0%b8%d0%be%d0%bd%d0%bd%d0%b0%d1%8f-%d0%b0%d1%80%d1%85%d0%b8%d1%82%d0%b5%d0%ba%d1%82%d1%83%d1%80%d0%b0-%d0%bd%d0%b0%d0%be%d0%b1%d0%be%d1%80%d0%be%d1%82/#comments</comments>
		<pubDate>Wed, 08 Apr 2009 10:23:39 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[алгоритмы]]></category>
		<category><![CDATA[информация]]></category>
		<category><![CDATA[поиск]]></category>
		<category><![CDATA[размышления]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=1527</guid>
		<description><![CDATA[<p>В прошлой заметке я писал про построение объектной карты сайта в практическом применении к поиску новостных страниц на сайтах для распознавания новостей. Разумеется, кроме этого применения есть и множество других, в основном не напрямую коммерческих или самозначных, но вспомогательных для других задач.</p> <p>Интересно и другое &#8212; анализ веб ресурсов очень тесно перекликается с их информационной [...]]]></description>
			<content:encoded><![CDATA[<p>В прошлой заметке я писал про построение объектной карты сайта в практическом применении к поиску новостных страниц на сайтах для распознавания новостей. Разумеется, кроме этого применения есть и множество других, в основном не напрямую коммерческих или самозначных, но вспомогательных для других задач.</p>
<p>Интересно и другое &#8212; анализ веб ресурсов очень тесно перекликается с их информационной архитектурой, условной логикой их структуры и принципов наполнения. </p>
<p>Фактически, практически любой веб сайт, может быть представлен в виде набора разного уровня сложности и вложенности шаблонов страниц, ссылок, принципов взаимодействия с другими сайтами и большого числа мета-информационных метрик характеризующих веб ресурс. </p>
<p>В конечном итоге эти шаблоны поддаются анализу и последующей визуализации полностью автоматически или с минимальной ручной корректировкой. И здесь очень бы к месту пришлись наработки в области исскуственного интеллекта и просто &#171;умные алгоритмы&#187; действующие по принципу формирования гипотез и апробации их в действии вплоть до нахождения оптимального результата. </p>
<p>Слабость этой идеи в слабой готовности как технически так и на уровне общего понимания. Если обработка информации предметной, как то космические снимки или анализ генов уже достигло области практического применения, то исследование принципов &#171;создания и жизни информации&#187; как явление, всё ещё изучено очень незначительно.  Фактически направления исследования информации можно разделить на те что ведутся поисковыми системами для повышения релевантности поисковой выдачи, поддержания сателлитных проектов и так далее, а также компаниями специализирующимися на обработке больших массивов данных из публичных источников.  </p>
<p>Анализ веб сайтов восстановление их информационной архитектуры за счёт автоматического анализа их содержимого применимо не только для этой задачи. Оно применимо для множества самых разных областей.</p>
<p>Например,  полгода назад, ища сайты по госзакупкам и объективно оценивая длительность поиска я с помощью небольшого автоматического скрипта искал такие сайты автоматически. Сейчас я знаю что большая часть работы которая шла в Еноте Поискуне по разбору веб страниц может быть доведена до автоматики на 90%. А то есть задача направленного индексирования с последующей структуризацией данных, может решаться без необходимости в разработке отдельных парсеров под каждый сайт, может решаться лишь с самым минимальным участием человека или же вообще без его участия.  </p>
<p>Впрочем направленное индексирование лишь одна из областей применения. Возвращаясь к распознаванию новостей, то у этой области есть простые и комплексные решения от распознавания только текста до деталей и медиаинформации. Единственная более-менее сложная задача в большом числе регулярных выражений.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2009/04/08/%d0%b8%d0%bd%d1%84%d0%be%d1%80%d0%bc%d0%b0%d1%86%d0%b8%d0%be%d0%bd%d0%bd%d0%b0%d1%8f-%d0%b0%d1%80%d1%85%d0%b8%d1%82%d0%b5%d0%ba%d1%82%d1%83%d1%80%d0%b0-%d0%bd%d0%b0%d0%be%d0%b1%d0%be%d1%80%d0%be%d1%82/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Работа с данными с нечеткой структурой</title>
		<link>http://ivan.begtin.name/2009/04/01/%d1%80%d0%b0%d0%b1%d0%be%d1%82%d0%b0-%d1%81-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d0%bc%d0%b8-%d1%81-%d0%bd%d0%b5%d1%87%d0%b5%d1%82%d0%ba%d0%be%d0%b9-%d1%81%d1%82%d1%80%d1%83%d0%ba%d1%82%d1%83%d1%80%d0%be/</link>
		<comments>http://ivan.begtin.name/2009/04/01/%d1%80%d0%b0%d0%b1%d0%be%d1%82%d0%b0-%d1%81-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d0%bc%d0%b8-%d1%81-%d0%bd%d0%b5%d1%87%d0%b5%d1%82%d0%ba%d0%be%d0%b9-%d1%81%d1%82%d1%80%d1%83%d0%ba%d1%82%d1%83%d1%80%d0%be/#comments</comments>
		<pubDate>Wed, 01 Apr 2009 07:32:39 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[алгоритмы]]></category>
		<category><![CDATA[информация]]></category>
		<category><![CDATA[поиск]]></category>
		<category><![CDATA[размышления]]></category>
		<category><![CDATA[скиур]]></category>
		<category><![CDATA[электронное государство]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=1500</guid>
		<description><![CDATA[<p>Прежде чем продолжить рассуждения, а что же такое данные с нечеткой структурой? Начну с примера.</p> <p>При преобразовании HTML в RSS, как, например, это происходит в <a href="http://www.skyur.ru">Скиуре</a>, очень часта ситуация когда структура данных меняется. Это может быть из-за того что немного подкрутили верстку или, к примеру, у новости появилась метка которая при обучении на данных сайта не [...]]]></description>
			<content:encoded><![CDATA[<p>Прежде чем продолжить рассуждения, а что же такое <span style="text-decoration: underline;">данные с нечеткой структурой</span>? Начну с примера.</p>
<p>При преобразовании HTML в RSS, как, например, это происходит в <a href="http://www.skyur.ru">Скиуре</a>, очень часта ситуация когда структура данных меняется. Это может быть из-за того что немного подкрутили верстку или, к примеру, у новости появилась метка которая при обучении на данных сайта не встречалась, но была с самого начала предусмотрена, например, &#171;новое&#187; или ещё что-либо не являющееся сменой CMS или реорганизацией структуры сайта, но затрагивающее HTML структуру ленты новостей.</p>
<p>Сейчас, чтобы обеспечить обработку новостной ленты  в любом случае, лента распознавание структуры Скиур производит каждый раз &#171;на лету&#187; полностью игнорируя любые ранее накопленные данные. Это позволяет обеспечить высокий уровень распознавания, ограниченный лишь числом поддерживаемых форматов дат и времени, но и накладывает ряд ограничений в числе которых:</p>
<ul>
<li>более долгий процесс извлечения структурных блоков;</li>
<li>невозможность ручной корректировки шаблона распознавания в виду его отсутствия.</li>
</ul>
<p>Это пример, ситуации и решения когда источник данных находится <span><span style="text-decoration: underline;">вне управления и возможности воздействия</span> </span>системы потребляющей его информацию и необходим ряд мер по приведению его к нормализованному виду за счёт предварительного или динамического распознавания структуры данных и приведение распознанной структуры к хранимых данных.</p>
<p>В случае новостной информации &#8212; это довольно просто и даже очень просто, поскольку структура транслируемых новостей давно уже определена в спецификациях RSS/ATOM, и то при распознавании достаточно 10% от специфицированных полей.  Кроме того отслеживание структурных аномалий для частного случая &#8212; это однократная и решаемая задача. Поиск решения для новостной информации закодированной в HTML у меня занял пару месяцев &#8212; в основном на анализ и систематизацию структуры данных в источниках. </p>
<p>А вот в случае условно неограниченного числа данных различных по структуре, форме размещения/публикации, способу хранения и так далее, ситуация отличается в корне. Без автоматизации процесса распознавания, без формализации поиска отклонений в структуре данных, без совмещения динамического формирования шаблонов с шаблонами уже накопленными &#8212; решить эту задачу невозможно. Фактически полноценное решение требует системы близкой по логике к ETL, но отличной в том что в отличии от ETL источники данных там не фиксированы, структуры данных могут меняться, новые источники могут добавляться даже при неполном описании приходящих из них данных, а все ошибки в обработке яляются не предметом приостановки процесса импорта или игнорирования, а обучения.  При этом, разумеется, необходимы специальные методы распознавания структур данных, решение проблемы производительности использования больших баз регулярных выражений и так далее.  </p>
<p>К вопросу о том зачем всё это нужно? Это нужно, поскольку сейчас процесс организации данных в Linked Data и иных связанных машиночитаемых формах &#8212; весьма долгосрочен. В каждом случае &#8212; это связано с долгим ожиданием когда владелец/контролёр источника данных решит представлять его в более удобной форме. При том что есть множество энтузиастов которые могут оцифровать тот или иной срез данных &#8212; как, например, статистические данные США или России, в машиночитаемую форму &#8212; тем не менее систематизация источников данных позволит обеспечить доступность данных на потоковой основе. </p>
<p>Или, говоря иначе, ненужно ждать пока государство начнёт отдавать данные в RDF или же общедоступные данные станут доступными в виде микроформатов или тех или иных срезов &#8212; необходимо создавать механизмы и программные продукты автоматизирующие процесс преобразования данных из Legacy форм в формы пригодные к последующей интеграции. </p>
<p>Всё это к вопрос о том как лично я вижу data.gov.ru  примерно через пару лет, разумеется, в случае его появления.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2009/04/01/%d1%80%d0%b0%d0%b1%d0%be%d1%82%d0%b0-%d1%81-%d0%b4%d0%b0%d0%bd%d0%bd%d1%8b%d0%bc%d0%b8-%d1%81-%d0%bd%d0%b5%d1%87%d0%b5%d1%82%d0%ba%d0%be%d0%b9-%d1%81%d1%82%d1%80%d1%83%d0%ba%d1%82%d1%83%d1%80%d0%be/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
		<item>
		<title>Yandex vs. Google vs. MailRu. Личное мнение</title>
		<link>http://ivan.begtin.name/2009/01/12/yandex-vs-google-vs-mailru-%d0%bb%d0%b8%d1%87%d0%bd%d0%be%d0%b5-%d0%bc%d0%bd%d0%b5%d0%bd%d0%b8%d0%b5/</link>
		<comments>http://ivan.begtin.name/2009/01/12/yandex-vs-google-vs-mailru-%d0%bb%d0%b8%d1%87%d0%bd%d0%be%d0%b5-%d0%bc%d0%bd%d0%b5%d0%bd%d0%b8%d0%b5/#comments</comments>
		<pubDate>Mon, 12 Jan 2009 06:12:31 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[e-Government]]></category>
		<category><![CDATA[eGov]]></category>
		<category><![CDATA[поиск]]></category>
		<category><![CDATA[электронное государство]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=1189</guid>
		<description><![CDATA[<p>Моё личное мнение на тему сможет ли Google выдавить Яндекс с места лидируещего поисковика в России или нет заключается в том что решение кроется не только в техническое конкуренции, но и целенаправленном лоббировании своих сервисов на государственном уровне. Благо есть значительное число онлайн сервисов которые государству нужны сейчас или будут нужны далее. Пример того же [...]]]></description>
			<content:encoded><![CDATA[<p>Моё личное мнение на тему сможет ли Google выдавить Яндекс с места лидируещего поисковика в России или нет заключается в том что решение кроется не только в техническое конкуренции, но и целенаправленном лоббировании своих сервисов на государственном уровне. Благо есть значительное число онлайн сервисов которые государству нужны сейчас или будут нужны далее. Пример того же mail.ru который запустил на школьном портале свой <a href="http://edu.gogo.ru/">edu.gogo.ru</a> показателен. При том что сам портал был крив как и поиск по началу, но смысл в том что медиа-компаниям а ля Google, Yandex, Rambler, Mail.ru есть что предложить государству, только делают они эти предложения пока довольно слабо.  А смысл то не в том чтобы ждать пока чиновники задумаются о новых ресурсах, а в целенаправленном лобби на их создание.</p>
<p>Правда, по моим наблюдениям, Яндекс всегда от государства держался так далеко как только возможно, и это может в итоге играть против них.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2009/01/12/yandex-vs-google-vs-mailru-%d0%bb%d0%b8%d1%87%d0%bd%d0%be%d0%b5-%d0%bc%d0%bd%d0%b5%d0%bd%d0%b8%d0%b5/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Ещё о регулярных выражениях и их анализе</title>
		<link>http://ivan.begtin.name/2009/01/11/%d0%b5%d1%89%d1%91-%d0%be-%d1%80%d0%b5%d0%b3%d1%83%d0%bb%d1%8f%d1%80%d0%bd%d1%8b%d1%85-%d0%b2%d1%8b%d1%80%d0%b0%d0%b6%d0%b5%d0%bd%d0%b8%d1%8f%d1%85-%d0%b8-%d0%b8%d1%85-%d0%b0%d0%bd%d0%b0%d0%bb%d0%b8/</link>
		<comments>http://ivan.begtin.name/2009/01/11/%d0%b5%d1%89%d1%91-%d0%be-%d1%80%d0%b5%d0%b3%d1%83%d0%bb%d1%8f%d1%80%d0%bd%d1%8b%d1%85-%d0%b2%d1%8b%d1%80%d0%b0%d0%b6%d0%b5%d0%bd%d0%b8%d1%8f%d1%85-%d0%b8-%d0%b8%d1%85-%d0%b0%d0%bd%d0%b0%d0%bb%d0%b8/#comments</comments>
		<pubDate>Sun, 11 Jan 2009 15:06:48 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[алгоритмы]]></category>
		<category><![CDATA[поиск]]></category>
		<category><![CDATA[размышления]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=1185</guid>
		<description><![CDATA[<p>Задача которую я затрагивал в предыдущем посте, конечно, решаема и даже понятно как её решать, вопрос лишь во времени и в оценке достаточности решения для решаемых задач.</p> <p>Например, лично я считаю что рассматривая регулярные выражения с целью их индексирования необходимо забыть про DFA и NFA и не вспоминать столь долго сколь это только возможно.</p> <p>Для [...]]]></description>
			<content:encoded><![CDATA[<p>Задача которую я затрагивал в предыдущем посте, конечно, решаема и даже понятно как её решать, вопрос лишь во времени и в оценке <em>достаточности решения </em>для решаемых задач.</p>
<p>Например, лично я считаю что рассматривая регулярные выражения с целью их индексирования необходимо забыть про DFA и NFA и не вспоминать столь долго сколь это только возможно.</p>
<p>Для анализа должно быть достаточно развёртывания регулярных выражений как дерева в соответствии с их написанием и последовательное построение &#171;шаблонов шаблонов&#187;, которые, как окажется, будут состоять из вполне измеримых &#171;микроблоков правил&#187;. Причём каждый из этих микроблоков будет обладать собственным набором метрик. Итоговое дерево выражения будет состоять из ветвей непосредственно правил подвергнутых группировке и кластеризации и рассчитанных ветвей метрик для каждого. При этом несмотря на то что хранение этих метрик может оказаться накладным процессом, тем не менее эти объёмы будут несравнимо меньше чем объёмы &#171;распакованных&#187; NFA.</p>
<p>Конечно всё это далее должно подвергаться проверке. Потребуется масса экспериментов дабы подобрать правильные метрики. Потребуется анализ входящего потока данных.</p>
<p>При этом важно не забывать особенность отличия работы алгоритмов проверки по массиву регулярных выражений, от алгоритмов поиска регулярными выражениями. Во втором случае обеспечить фильтрацию куда проще поскольку нет ограничений на построение индексов, а вот в первом случае это не получится и ресурсоёмкость задачи другая.</p>
<p>На самом деле жаль что её так никто и не решил. В моём понимании моделирование алгоритмов анализа дерева HTML и прочих полуструктурированных данных куда увлекательнее чем моделирование алгоритмов анализа деревьев RE. Но пока получается что эта нерешённая задача, тормозит решение остальных.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2009/01/11/%d0%b5%d1%89%d1%91-%d0%be-%d1%80%d0%b5%d0%b3%d1%83%d0%bb%d1%8f%d1%80%d0%bd%d1%8b%d1%85-%d0%b2%d1%8b%d1%80%d0%b0%d0%b6%d0%b5%d0%bd%d0%b8%d1%8f%d1%85-%d0%b8-%d0%b8%d1%85-%d0%b0%d0%bd%d0%b0%d0%bb%d0%b8/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Cсылки на 1.01.2009: Twitter, IR, инструменты, профили в соц. сетях и другое</title>
		<link>http://ivan.begtin.name/2009/01/01/c%d1%81%d1%8b%d0%bb%d0%ba%d0%b8-%d0%bd%d0%b0-1012009-twitter-ir-%d0%b8%d0%bd%d1%81%d1%82%d1%80%d1%83%d0%bc%d0%b5%d0%bd%d1%82%d1%8b-%d0%bf%d1%80%d0%be%d1%84%d0%b8%d0%bb%d0%b8-%d0%b2-%d1%81%d0%be/</link>
		<comments>http://ivan.begtin.name/2009/01/01/c%d1%81%d1%8b%d0%bb%d0%ba%d0%b8-%d0%bd%d0%b0-1012009-twitter-ir-%d0%b8%d0%bd%d1%81%d1%82%d1%80%d1%83%d0%bc%d0%b5%d0%bd%d1%82%d1%8b-%d0%bf%d1%80%d0%be%d1%84%d0%b8%d0%bb%d0%b8-%d0%b2-%d1%81%d0%be/#comments</comments>
		<pubDate>Thu, 01 Jan 2009 11:45:26 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[links]]></category>
		<category><![CDATA[алгоритмы]]></category>
		<category><![CDATA[информация]]></category>
		<category><![CDATA[поиск]]></category>
		<category><![CDATA[социальные сети]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=1150</guid>
		<description><![CDATA[<p>Социальные сети, Twitter, Evernote и так далее:</p> <a href="http://http://www.twhirl.org/">TWHirl</a> &#8212; удобное настольное ПО для работы с Twitter&#8217;ом изготовленный с помощью Adobe AIR. Бесплатный, удобный, англоязычный. У него есть и российский сайт &#8212; <a href="http://twhirl.ru">http://twhirl.ru</a>, но пока его не пробовал. <a href="http://www.aboutfacedigital.com/blog/2008/12/05/c-level-tweeters/">CEO/CIO/CTO Twitters list</a> &#8212; большая подборка на Twitter Feeds различных CIO, CTO и CEO американских [...]]]></description>
			<content:encoded><![CDATA[<p><strong>Социальные сети, Twitter, Evernote и так далее:</strong></p>
<ul>
<li><a href="http://http://www.twhirl.org/">TWHirl</a> &#8212; удобное настольное ПО для работы с Twitter&#8217;ом изготовленный с помощью Adobe AIR. Бесплатный, удобный, англоязычный. У него есть и российский сайт &#8212; <a href="http://twhirl.ru">http://twhirl.ru</a>, но пока его не пробовал.</li>
<li><a href="http://www.aboutfacedigital.com/blog/2008/12/05/c-level-tweeters/">CEO/CIO/CTO Twitters list</a> &#8212; большая подборка на Twitter Feeds различных CIO, CTO и CEO американских компаний. Поимённо приводить не буду, каждый найдёт кого-то интересного для чтения.</li>
<li><a href="http://twitter.com/evernote">Evernote Twitter Feed</a> &#8212; лента сообщений о Evernote.</li>
<li><a href="http://theweeklyreview.ca/2008/12/22/is-evernote-the-perfect-gtd-app/">Evernote as perfect GTD App</a> &#8212; статья о  использовании Evernote как GTD</li>
<li><a href="http://tarpipe.com">TarPipe</a> &#8212; онлайновый инструмент для множественной публикации сразу во многих сервисах. Между прочим, используют <a href="http://incubator.apache.org/couchdb/">Couchdb</a> внутри сервиса.</li>
</ul>
<p><strong>Information Retrieval:</strong></p>
<ul>
<li><a href="http://www.llrx.com/features/deepweb2009.htm">Deep Web Research 2009</a> &#8212; материалы по глубокому индексированию</li>
<li><a href="http://www.webology.ir/">Webology.Ir</a> &#8212; журнал по Information Retrieval</li>
<li><a href="http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html">Introduction to Information Retrieval</a> &#8212; книга по IR онлайн</li>
<li><a href="http://combine.it.lth.se/">Combine</a> &#8212; сфокусированный краулер (индексатор) с открытым кодом</li>
<li><a href="http://www.miislita.com/">MI Islita</a> &#8212; ресурс по Information Extraction</li>
</ul>
<p><strong>Мои профили в Twitter, FriendFeed и других соц. сетях:</strong></p>
<ul>
<li><a href="http://ivan.begtin.name">http://ivan.begtin.name</a> &#8212; первоисточник всех записей, стендалаун блог.</li>
<li><a href="http://ivbeg.livejournal.com">http://ivbeg.livejournal.com</a> &#8212; основное зеркало на Livejournal</li>
<li><a href="http://ibegtin.ya.ru">http://ibegtin.ya.ru</a> &#8212; зеркало на Я.Беточке</li>
<li><a href="http://twitter.com/ibegtin">http://twitter.com/ibegtin</a> &#8212; лента в Twitter, полностью англоязычная, о технологиях немного</li>
<li><a href="http://friendfeed.com/ivbeg">http://friendfeed.com/ivbeg</a> &#8212; всё вместе во FriendFeed<a href="http://friendfeed.com/ivbeg"><br />
</a></li>
<li><a href="http://delicious.com/ibegtin">http://delicious.com/ibegtin</a> &#8212; публично доступные букмарки для тех кто интересуется темами e-Gov, IR, работой со справочниками и так далее. По возможности всё детализировано по ключевым словам и по ним можно отслеживать новое тем кому это интересно.</li>
</ul>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2009/01/01/c%d1%81%d1%8b%d0%bb%d0%ba%d0%b8-%d0%bd%d0%b0-1012009-twitter-ir-%d0%b8%d0%bd%d1%81%d1%82%d1%80%d1%83%d0%bc%d0%b5%d0%bd%d1%82%d1%8b-%d0%bf%d1%80%d0%be%d1%84%d0%b8%d0%bb%d0%b8-%d0%b2-%d1%81%d0%be/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Официальный гайд Google по SEO</title>
		<link>http://ivan.begtin.name/2008/11/13/%d0%be%d1%84%d0%b8%d1%86%d0%b8%d0%b0%d0%bb%d1%8c%d0%bd%d1%8b%d0%b9-%d0%b3%d0%b0%d0%b9%d0%b4-google-%d0%bf%d0%be-seo/</link>
		<comments>http://ivan.begtin.name/2008/11/13/%d0%be%d1%84%d0%b8%d1%86%d0%b8%d0%b0%d0%bb%d1%8c%d0%bd%d1%8b%d0%b9-%d0%b3%d0%b0%d0%b9%d0%b4-google-%d0%bf%d0%be-seo/#comments</comments>
		<pubDate>Thu, 13 Nov 2008 07:49:36 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[google]]></category>
		<category><![CDATA[web]]></category>
		<category><![CDATA[поиск]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=918</guid>
		<description><![CDATA[<p>Гугл <a href="http://googlewebmastercentral.blogspot.com/2008/11/googles-seo-starter-guide.html">опубликовали</a> у себя в блоге <a href="http://www.google.com/webmasters/docs/search-engine-optimization-starter-guide.pdf">22 страничный PDF документ</a> с рекомендациями по оптимизации сайтов под поисковые системы.</p> <p>Нового там мало, основной акцент на правильной подачи собственного контента.</p> <p>В то же время, что характерно, правила описанные там значительно пересекаются с общими правилами подачи информации которые я ранее упоминал у себя в блоге.</p> <p>Кстати, [...]]]></description>
			<content:encoded><![CDATA[<p>Гугл <a href="http://googlewebmastercentral.blogspot.com/2008/11/googles-seo-starter-guide.html">опубликовали</a> у себя в блоге <a href="http://www.google.com/webmasters/docs/search-engine-optimization-starter-guide.pdf">22 страничный PDF документ</a> с рекомендациями по оптимизации сайтов под поисковые системы.</p>
<p>Нового там мало, основной акцент на правильной подачи собственного контента.</p>
<p>В то же время, что характерно, правила описанные там значительно пересекаются с общими правилами подачи информации которые я ранее упоминал у себя в блоге.</p>
<p>Кстати, многие из этих правил поддаются формализации и значительной автоматизации в рамках CMS систем.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2008/11/13/%d0%be%d1%84%d0%b8%d1%86%d0%b8%d0%b0%d0%bb%d1%8c%d0%bd%d1%8b%d0%b9-%d0%b3%d0%b0%d0%b9%d0%b4-google-%d0%bf%d0%be-seo/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Ссылки. Поиск схожих изображений и прочие поиски по изображениям</title>
		<link>http://ivan.begtin.name/2008/10/28/%d1%81%d1%81%d1%8b%d0%bb%d0%ba%d0%b8-%d0%bf%d0%be%d0%b8%d1%81%d0%ba-%d1%81%d1%85%d0%be%d0%b6%d0%b8%d1%85-%d0%b8%d0%b7%d0%be%d0%b1%d1%80%d0%b0%d0%b6%d0%b5%d0%bd%d0%b8%d0%b9-%d0%b8-%d0%bf%d1%80%d0%be/</link>
		<comments>http://ivan.begtin.name/2008/10/28/%d1%81%d1%81%d1%8b%d0%bb%d0%ba%d0%b8-%d0%bf%d0%be%d0%b8%d1%81%d0%ba-%d1%81%d1%85%d0%be%d0%b6%d0%b8%d1%85-%d0%b8%d0%b7%d0%be%d0%b1%d1%80%d0%b0%d0%b6%d0%b5%d0%bd%d0%b8%d0%b9-%d0%b8-%d0%bf%d1%80%d0%be/#comments</comments>
		<pubDate>Tue, 28 Oct 2008 15:30:15 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[поиск]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=868</guid>
		<description><![CDATA[<a href="http://www.alipr.com">Alipr</a> &#8212; Automatic Photo Tagging and Visual Image Search <a href="http://wang14.ist.psu.edu/cgi-bin/zwang/regionsearch_show.cgi">Simplicity</a> &#8212; Semantics-sensitive Integrated Matching for Picture LIbraries <a href="http://wang.ist.psu.edu/IMAGE/alip.html">a-LIP</a> &#8212; Automatic Linguistic Indexing of Pictures <a href="http://www.tiltomo.com/">Tiltomo</a> &#8212; поиск изображений по похожести <a href="http://www.cydral.com/">Cydral</a> &#8212; поисковик родом из франции (на английском) <a href="http://www.gazopa.com/">Gazopa</a> &#8212; поисковик как венчурный проект Hitachi работающий в полузакрытом режиме. [...]]]></description>
			<content:encoded><![CDATA[<ul>
<li><a href="http://www.alipr.com">Alipr</a> &#8212; Automatic Photo Tagging and Visual Image Search</li>
<li><a href="http://wang14.ist.psu.edu/cgi-bin/zwang/regionsearch_show.cgi">Simplicity</a> &#8212; Semantics-sensitive Integrated Matching for Picture LIbraries</li>
<li><a href="http://wang.ist.psu.edu/IMAGE/alip.html">a-LIP</a> &#8212; Automatic Linguistic Indexing of Pictures</li>
<li><a href="http://www.tiltomo.com/">Tiltomo</a> &#8212; поиск изображений по похожести</li>
<li><a href="http://www.cydral.com/">Cydral</a> &#8212; поисковик родом из франции (на английском)</li>
<li><a href="http://www.gazopa.com/">Gazopa</a> &#8212; поисковик как венчурный проект Hitachi работающий в полузакрытом режиме.</li>
<li><a href="http://www.vimatech.com/">Vima Technology</a> &#8212; предлагают продукты поиска Vima Search</li>
<li><a href="http://www.ltutech.com">LTUTech</a> &#8212; также предлагают продукты поиска и распознавания изображений</li>
<li><a href="http://tineye.com">TinEye</a> &#8212; поиск разработки компании <a href="http://ideeinc.com/">Idee</a> которые кроме того поддерживают проекты визуального поиска в <a href="http://labs.ideeinc.com/">Idee Labs</a>. Их же, кстати, используют в Digg для отслеживания дубликатов размещаемых изображений.</li>
</ul>
<p>Отличие поисковиков по подобиям в том что они не могут сделать простой фильтр по пропорциям в отличии от фильтров дубликатов и в том что у них нет словарной базы.</p>
<p>Кстати, поиск похожих изображений это один из способов, правда как оказалось не сильно удачных, для выявления &#171;взрослых картинок&#187;.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2008/10/28/%d1%81%d1%81%d1%8b%d0%bb%d0%ba%d0%b8-%d0%bf%d0%be%d0%b8%d1%81%d0%ba-%d1%81%d1%85%d0%be%d0%b6%d0%b8%d1%85-%d0%b8%d0%b7%d0%be%d0%b1%d1%80%d0%b0%d0%b6%d0%b5%d0%bd%d0%b8%d0%b9-%d0%b8-%d0%bf%d1%80%d0%be/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>О поисках по отдельным сайтам и CMS</title>
		<link>http://ivan.begtin.name/2008/10/23/%d0%be-%d0%bf%d0%be%d0%b8%d1%81%d0%ba%d0%b0%d1%85-%d0%bf%d0%be-%d0%be%d1%82%d0%b4%d0%b5%d0%bb%d1%8c%d0%bd%d1%8b%d0%bc-%d1%81%d0%b0%d0%b9%d1%82%d0%b0%d0%bc-%d0%b8-cms/</link>
		<comments>http://ivan.begtin.name/2008/10/23/%d0%be-%d0%bf%d0%be%d0%b8%d1%81%d0%ba%d0%b0%d1%85-%d0%bf%d0%be-%d0%be%d1%82%d0%b4%d0%b5%d0%bb%d1%8c%d0%bd%d1%8b%d0%bc-%d1%81%d0%b0%d0%b9%d1%82%d0%b0%d0%bc-%d0%b8-cms/#comments</comments>
		<pubDate>Thu, 23 Oct 2008 08:06:46 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[web]]></category>
		<category><![CDATA[идеи]]></category>
		<category><![CDATA[поиск]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=838</guid>
		<description><![CDATA[<p>Что меня удивляло и продолжает удивлять так это так это нерасторопность поисковых машин, за исключением Google,  в продвижении своих сервисов везде где только возможно.</p> <p>Например, организация поиска по собственному сайту с помощью внешнего поисковика требует хоть и не слишком многих, но всё же усилий и хотя бы небольшого понимания HTML. Да и многие просто ленятся [...]]]></description>
			<content:encoded><![CDATA[<p>Что меня удивляло и продолжает удивлять так это так это нерасторопность поисковых машин, за исключением Google,  в продвижении своих сервисов везде где только возможно.</p>
<p>Например, организация поиска по собственному сайту с помощью внешнего поисковика требует хоть и не слишком многих, но всё же усилий и хотя бы небольшого понимания HTML. Да и многие просто ленятся делать, то что можно не делать.</p>
<p>Вот я и не могу понять что мешает поисковым машинам:</p>
<p>1. Спонсировать разработчиков open-source CMS для поддержки поиска по внешней системы &#171;из коробки&#187;.</p>
<p>2. Договариваться с разработчиками коммерческих CMS а ля 1С-Битрикс для поддержки внешнего поиска из коробки или же опционально.</p>
<p>3. Договариваться с провайдерами о том чтобы на их хостингах CMS продукты включали модули, возможности и расширения для поиска через внешний поисковик.</p>
<p>Вот вам и будет увеличение доли поисковой машины на рынке поиска. Всё таки владельцев сайтов десятки и сотни тысяч, а создателей значимых CMS десятки и сотни. С сотней человек договорится проще.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2008/10/23/%d0%be-%d0%bf%d0%be%d0%b8%d1%81%d0%ba%d0%b0%d1%85-%d0%bf%d0%be-%d0%be%d1%82%d0%b4%d0%b5%d0%bb%d1%8c%d0%bd%d1%8b%d0%bc-%d1%81%d0%b0%d0%b9%d1%82%d0%b0%d0%bc-%d0%b8-cms/feed/</wfw:commentRss>
		<slash:comments>4</slash:comments>
		</item>
		<item>
		<title>Веб, списки и уникальность страниц</title>
		<link>http://ivan.begtin.name/2008/10/22/%d0%b2%d0%b5%d0%b1-%d1%81%d0%bf%d0%b8%d1%81%d0%ba%d0%b8-%d0%b8-%d1%83%d0%bd%d0%b8%d0%ba%d0%b0%d0%bb%d1%8c%d0%bd%d0%be%d1%81%d1%82%d1%8c-%d1%81%d1%82%d1%80%d0%b0%d0%bd%d0%b8%d1%86/</link>
		<comments>http://ivan.begtin.name/2008/10/22/%d0%b2%d0%b5%d0%b1-%d1%81%d0%bf%d0%b8%d1%81%d0%ba%d0%b8-%d0%b8-%d1%83%d0%bd%d0%b8%d0%ba%d0%b0%d0%bb%d1%8c%d0%bd%d0%be%d1%81%d1%82%d1%8c-%d1%81%d1%82%d1%80%d0%b0%d0%bd%d0%b8%d1%86/#comments</comments>
		<pubDate>Wed, 22 Oct 2008 03:25:20 +0000</pubDate>
		<dc:creator>ivbeg</dc:creator>
				<category><![CDATA[web]]></category>
		<category><![CDATA[поиск]]></category>
		<category><![CDATA[юзабилити]]></category>

		<guid isPermaLink="false">http://ivan.begtin.name/?p=834</guid>
		<description><![CDATA[<p>Относительно недавно, размышляя над <a href="http://ivbeg.livejournal.com/132197.html">антипаттернами юзабилити</a>, там же я упоминал про такое явление как сдвиге идентификаторов элементов веб списках. Это довольно большая тема сама по себе и я раскрою её подробнее.</p> <p>Вначале озвучу проблему: подавляющее число информационных систем никак не учитывают формы представления информации которую они предоставляют пользователям и не только им.</p> <p>Рассмотрим несколько [...]]]></description>
			<content:encoded><![CDATA[<p>Относительно недавно, размышляя над <a href="http://ivbeg.livejournal.com/132197.html">антипаттернами юзабилити</a>, там же я упоминал про такое явление как сдвиге идентификаторов элементов веб списках. Это довольно большая тема сама по себе и я раскрою её подробнее.</p>
<p>Вначале озвучу проблему: подавляющее число информационных систем никак не учитывают <span style="text-decoration: underline;">формы представления</span> информации которую они предоставляют пользователям и не только им.</p>
<p>Рассмотрим несколько примеров.</p>
<p>Предположим есть веб сайт на котором размещаются новости и этих новостей может накопиться довольно немало со временем, для чего их список на сайте разбивается на страницы. Практически всегда список из этих страниц будет перевёрнутым, а то есть последние новости всегда будут на первой странице. Технически понятно отчего так происходит &#8212; программисты делают нумерацию списков практически всегда в сторону увеличения номеров страниц и внутри простореализуется сортировка по дате по убыванию. Но по смыслу и по форме представления &#8212; это неверно.</p>
<p>Для того чтобы далее было проще описать ситуацию я введу термин <strong>LISA (Last In. Shift All)</strong> -построение списка элементов при котором любой новый элемент становится первым сдвигает номера остальных.</p>
<p>Предположим, у нас уже есть 100 опубликованных новостей, 10 страниц по 10 новостей на одной странице. Что произойдёт после того как мы добавим ещё одну новость? Появится 11 страница и полностью изменится содержимое всех остальных 10 поскольку добавленная новость сдвинет все предыдущие на одну позицию в отсортированном списке.</p>
<p>Поисковые системы которые данный сайт индексируют потребуется обновить не только последнюю страницу с изменениями, но все 10 страниц. А ведь списки где элементов вовсе не 100, а тысячи и при подобном подходе с полным сдвигом всех элементов,поисковик будет переиндексировать все веб страницы списка, создавать дополнительную нагрузку на сайт, которой можно было бы избежать организовав представление информации иначе.</p>
<p>Также добавлю что список новостей может быть разным. Если в некоторых случаях это лишь списки дата/текст/ссылка на полное описание, то в других случаях ссылки могут и отсутствовать и тогда LISA списки не просто мешают поисковикам, они мешают и пользователям, поскольку становится бессмысленным сохранение ссылки на страницу списка в закладки, ибо новости с неё &#171;уедут&#187;. Подобные списки нарушают один из ключевых принципов находимости информации &#8212; уникальности ссылки на информационный объект и возможности быстрого возврата к нему.</p>
<p>Примеров таких списков более чем множество. Даже Вордпресс на котором работает мой блог нумерует страницы считая последнюю первой.</p>
<p>Альтернативные решения по разделению таких списков могут быть разными. Например, при относительно небольшом числе новостей, они могут быть выделены <a href="http://www.ach.gov.ru/news/archive/">по годам и месяцам</a>, когда совсем мало, то <a href="http://company.yandex.ru/news/">только по годам</a>, а также можно наконец и прийти к правильной нумерации страниц, например, как это сделано в <a href="http://www.nge.ru/catalog_list_7_13.htm">каталоге nge.ru</a>.</p>
<p><span id="more-834"></span></p>
<p>Возьмём другой пример &#8212; каталог организаций рассортированных в алфавитном порядке по имени. Организаций обычно бывает много, пусть у нас их будет порядка 2000 по 25 на странице, всего 80 страниц. Что происходит когда добавляется новая организация &#8212; технически, в базу попадает просто новая запись, но форма представления меняется таким образом что новая запись сдвигает все последующие за ней ровно на единицу и число сдвинутых записей зависит от имени новой. Такие формы списков можно назвать <strong>LISP (Last in. Shift part)</strong>. Тем самым получая новый элемент списка мы можем предсказать каким будет сдвиг списка в целом, но мы не можем предсказать какой же элемент мы получим и как придётся сдвигать, не зная содержимого элемента. Понятно также что это распространяется не только для списков с алфавитной сортировкой по именам, а ко всем постраничным спискам с сортировкой отличающейся от сортировки по последнему идентификатору или по последней дате. В этом случае поисковые машины при повторном индексировании будут обходить уже не все страницы, а только затронутые сдвигом. На уникальность ссылки для пользователей влияние также будет зависеть от того как именно элемент сдвигает все остальные.</p>
<p>Надо отдать должное что в случае LISP списков, некоторые ресурсы предпринимают дополнительные усилия по по организации работы с ними. Например, список <a href="http://www.fapmc.ru/smi/p-smi/">печатных СМИ</a> на сайте Федерального агенства по печати и массовым коммуникациям отличается двойной сортировкой. На первом уровне записи рассортированы по первым буквам названий и лишь на втором они разбиты постранично в рамках выбранной буквы. Если, к примеру,  добавлять новое СМИ, то изменится не более чем страниц под определённую букву, это от 1 до 10 страниц, но не никак не несколько сотен.</p>
<p>Почему это вообще важно? Причины в проблемах для поисковиков и пользователях что я озвучил выше.</p>
<p>Например, если сейчас большая тройка поисковиков предлагает к использованию Sitemap&#8217;ы, то в будущем организация их работы с сайтами может быть расширена до рекомендаций по организации публикации информации таким образом чтобы индексирование сайта было бы оптимальным как по полноте, так и по времени и объёмам данных. Эти рекомендации помноженные на примеры реорганизации публикации списков могут оказаться весьма полезными и веб местерам желающих снизить нагрузку на свои сайты создаваемую поисковыми роботами. Пользователям же важно иметь возможность находить информацию и работать с ней в удобной и предсказуемой форме.</p>
<p>В дальнейшем, я считаю, что появятся средства автоматического построения наиболее оптимальных средств навигации по данными в рамках одного ресурса которые бы зависели от объёмов, характера и содержимого записей публикуемых в списках. Тем самым появится возможность определения <strong>навигационных моделей</strong> и <strong>навигационных индексов</strong> причём практически автоматически, без участия человека.</p>
]]></content:encoded>
			<wfw:commentRss>http://ivan.begtin.name/2008/10/22/%d0%b2%d0%b5%d0%b1-%d1%81%d0%bf%d0%b8%d1%81%d0%ba%d0%b8-%d0%b8-%d1%83%d0%bd%d0%b8%d0%ba%d0%b0%d0%bb%d1%8c%d0%bd%d0%be%d1%81%d1%82%d1%8c-%d1%81%d1%82%d1%80%d0%b0%d0%bd%d0%b8%d1%86/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
	</channel>
</rss>

