О спаме тезисно и с примерами. Часть 2.

1. Наблюдение последних дней резкое увеличение числа типового почтового спама с визуально заметными искажениями текста вроде вставки символов { и _ между букв. Текст становится предельно нечитаемым и визуально однозначно определяемый как Спам. Интересно на что рассчитывают рассылающие его?

2. Наблюдение за поисковым спамом на веб сайтах — сразу на нескольких сайтах из наиболее популярных сетевых изданий число платных ссылок резко уменьшилось, кое-где до нуля, к чему бы это?

3. Как и предполагалось сегмент «белой части» Рунета не так уж и мал, хотя и весьма специфичен. Равно как и специфичен сегмент «серой части». Например, практику размещения платных ссылок можно также рассматривать и репутационную модель. Лично меня удивило что банки вроде Альфа-Банка и Райффейзена размещают платные ссылки довольно часто.

Пример ссылки на www.annews.ru в конце страницы, их, также, можно посмотреть в Урлусе (от 3 до 6 секунд на анализ и загрузку).

4. Можно сказать что уже окончательный вывод — весовой анализ ссылок для классификации их как поисковый спам необходим лишь не более для 10% от общего числа, в остальных случаях однозначно верно работает классификация по уровня «да/нет». Я могу лишь предполагать что у поисковых систем и их создателей есть какие-либо свои причины чтобы их учитывать, так их выявление это уже практически элементарная задача.

5. Можно ли верить что на официальных сайтах гос. учереждений нет поискового спама? Увы нет.

И вот несколько примеров:

От Российской газеты я этого особенно не ожидал. Как, прямо скажем, несолидно для серьёзного издания.

А вот с официального сайта города Обнинск (http://obninsk.ru) ссылки исчезли, хотя и были там ещё полтора месяца назад.

6. Можно ли предполагать что поисковый спам не затрагивает популярные блоги? Лишь отчасти поскольку щепетильны не все.

Например из TOP 20 Standalone блогов по рейтингу Яндекса поисковый спам выявился лишь в 3 из них, это:

В остальных как максимум контекстная или иная реклама, но не поисковый спам.

Эти сайты выявлялись уже не через Урлус, он плохо срабатывает на блогах, а с помощью оффлайн алгоритма.

About This Author

Яндекс.Метрика