Посты в категории: %d0%b8%d0%bd%d1%84%d0%be%d1%80%d0%bc%d0%b0%d1%86%d0%b8%d1%8f

Новое на Гослюдях.Ру: Антирейтинг, много RSS и фото/видео лента

В Гослюдях много небольших, но заметных обновлений. Целиком приводить не буду, лучше почитать на Полит.Ру тут — http://www.polit.ru/country/2010/03/30/goslyudi.html

Остановлюсь же на главном. Итак что нового:
1. Появились разделы фото www.goslyudi.ru/photos и видеоленты — www.goslyudi.ru/video/ где размещаются последние видео и фотографии из блогов гослюдей. В каждом из разделов есть

Читать больше

Онтология и примеры анализа кодов и идентификаторов

Почти год назад я писал на эту  тему в заметке Систематизация расшифровки кодов и управления справочниками, а сейчас продолжу приостановленные тогда размышления.

Если вкратце, то основной постулат такой — подавляющее число маркирующих кодов и уникальных идентификаторов создаются по ограниченному числу правил и подлежат разложению на ряд признаков позволяющих связывать эти

Читать больше

Онлайн API и идентификация языка

На днях искал онлайновые сервисы способные помочь при работе с разного рода информацией, в частности одна из задач в определении кодировок и языка веб-страниц, ибо возможность переложить эту рутинную задачу на какой-либо сервис онлайн часть ресурсов может высвободить.

В результате посмотрел на LangId.net и AlchemyAPI и там

Читать больше

Об особенностях направленного сбора информации

Я ранее не раз поднимал вопрос о направленном индексировании здесь: http://ivan.begtin.name/2008/10/14/направленное-индексирование-и-верти/ и здесь http://ivan.begtin.name/2009/04/08/информационная-архитектура-наоборот/

В общем-то это именно та задача которой в разных формах я в последнее время сталкиваюсь постоянно,

Предположим есть группа сайтов с которых необхдимо собрать некую информацию. К примеру, пройтись по сайтам всех периодических печатных и собрать с

Читать больше

Торрент трекер для датасетов и открытых данных

Игорь Артамонов буквально вот-вот запустил сайт http://www.datasetpublisher.com/ где будут публиковаться torrent’ы открытых данных которыми бы хотелось поделиться и которые хотелось бы скачать.

Пока данных там немного, но уверен что будет больше нашими совместными усилиями.

Плюс если Вы какие-то данные ищите и они публичны можно, например, отписаться мне и я буду

Читать больше

Мнение про Wolfram Alpha и Semantic Web

Недавно обнаружил в блоге у Mencius Moldbug довольно интересное мнение про Wolfram Alpha. Жаль не прочитал его ранее, там есть целый ряд интересных мыслей.

Но, пожалуй, одна из самых интересных в предсказуемости результатов в WA. Фактически он назsвает Wolfram Alpha — «control interface» и сравнивает с Google который таким

Читать больше

Немного о глубоком анализе HTML

Примерно с полгода назад я писал о таком явлении как метрики анализа HTML, какие они бывают и что с ними происходит сейчас же я расскажу про то же, но подробнее.

1. Уровень тэга (tag level)

Эта метрика определяет вложенность тэга в общем дереве и

Читать больше

Вопросы мотивации

У Лоис Макмастер Буджолд в серии книг про Барраяр есть одно запомнившееся мне высказывание высказывание «Деньги, власть, секс… и слоны.«, оно упоминается в книге «Память» где главные герои рассуждают о человеческой мотивации. А если найти там этот момент, например, прочитав тут в 20 главе, то там «слон» — это самый настоящий

Читать больше

RIW 2009. Впечатления

Только что вернулся с RIW 2009, а всего я там присутствовал в течении двух дней 22-го и сегодня, 24-го.  Могу сказать что было как интересное так и довольно скучное.

22-го я был на секции «ИКТ для государства» там должны были выступать Станислав Наумов (зам. министра Минпромторговли) и Илья Пономарев (депутат от

Читать больше

Яндекс.Метрика