Посты в категории: razmyishleniya

Копирайт, спам и блоги

Надо отдать должное поисковикам — найти «контентных воров» через них куда проще чем чем как-либо ещё, правда связано это не с качеством поиска, а с недостатным качеством — так как из индексной базы поисковика такие спамеры не исчезают иногда очень долгое время.

Например, недавно через Яндекс обнаружился вот такой сплог-аггрегатор

earth-news.ru/sites/i/ivan.begtin.name/

Что в

Читать больше

Лингвистика. Частотный анализ — 2.

Ранее я писал про работу с текстом и частотный анализ, например, то что при наличии первой и последней буквы и перемешанных остальных слово прочитать возможно. Несмотря на сомнения некоторых читателей, я всё же ещё раз хочу подтвердить — для того чтобы понимать слово, особенно в контексте, часто достаточно только

Читать больше

Что закупает государство в ИТ.

Собираю разную интересную статистику по закупкам набрал вот такую интересную подборку.

Закупка услуг SEO:

«Шинглопринтинг». Материалы и по выявлению близких подобий

Ссылки:

Правы ли в Yahoo сопротивляясь поглощению?

Читаю статью в Business Week «Is Yahoo right to Resist Microsoft?»

Там поднимается сразу несколько вопросов и ответов на них о том почему же Янг и руководство компании так упорно сопротивляется поглощению.

Пожалуй, самое интересное  — это два события которые должны произойти в этом месяце

1. 22 апреля Yahoo публикует квартальный отчет

Читать больше

Поисковый антиспам. Алгоритмы

Продолжая тему борьбы с поисковым спамом, основные направления я уже описывал по отдельности, чуть подробнее о всех вместе, на основе публично доступных материалов.

1. Анализ хостграфов и плотности PageRank

Подход на 100% математический и требующих больших вычислительных мощностей для работы. В частности детально рассматриваются все аномалии в разницах весов ссылающихся страниц и

Читать больше

Программирование для историков

Два канадских учёных и историка пишут монографию — Programming History. При этом все материалы доступны онлайн http://niche.uwo.ca/programming-historian/index.php/Main_Page

Подход интересен — программирование приводится не как профессия, а как приготовление пищи по сборникам рецептов. А сами рецепты подбираются уже под специфичные узкие задачи.

Например, для историков: извлечение текстов, анализ частот слов, анализ слов

Читать больше

Информация vs. Технологии

Я ранее уже писал о конкуренции между технологическими и информационными компаниями и, развивая тему, в чём же специфика этой конкуренции. Далее пойдут размышения, которые многим могут показаться банальными, но тем не менее.

На мой взгляд корень этой конкуренции в том что ИТ, в глобальном тренде, находится в период перелома

Читать больше

Структуры данных и их анализ. Сугубо техническое

Я периодически публикую записи о том как выявляются платные ссылки — это что-то вроде хобби, довольно  непростая задача, со множеством весьма нетривиальных выводов, к счастью, в ней оказалось меньше необходимости в сложных мат. формулах, во всяком случае пока. На самом же деле смысл не в ссылках как таковых, ссылки следствие, а

Читать больше

Бизнес модель «обесценивания» в конкуренции в ИТ

Чем дольше я наблюдаю за ИТ рынком, тем больше убеждаюсь что помимо классической модели конкуренции, когда есть предметная область и набор продуктов её покрывающих в той или иной степени, приходит принципиально иная бизнес модель — обесценивания продукции конкурентов.

Что это такое? Приведу пример из головы. Предположим есть небольшой город жители

Читать больше

Яндекс.Метрика