АнтиСЕО. Правила анализа и выявления
Несмотря на то что про АнтиСЕО я давно не писал, тему я не забыл, лишь куда меньше осталось времени на написание озвученной мною книги. Тема интересная, но утомительная, а главное что проверять правила сложно, поскольку представители поисковиков формальных критериев отличия SEO ссылок от не-SEO ссылок никогда не назовут, так как полное формальное определение раскроет их алгоритмы отсева.
Соответственно большую часть материалов я решил публиковать у себя в блоге, далее посты пойдут под рубрикой антисео, а сейчас приведу перечень правил с их группировкой по принципам анализа. Каждое правило я буду расписывать подробнее в последующих постах, если по каким-либо из них будет желание прочитать больше информации в первую очередь — пишите какие именно интересуют, с них и начну.
Добавлю к написанному то что:
- все правила идут под статусом ИМХО. Это не руководство к действию, а гипотезы, предположения и кулинарная книга.
- текущая классификация правил неидеальна, но лучше пока нет.
- правила не конвертируются в метрики автоматически. Некоторые могут быть представлены одним, а некоторые до 5 численных показателей.
- на практике у поисковых систем есть _гораздо_ более эффективные способы фильтрации поискового спама. Как они их применяют и применяют ли, другой вопрос, но как факт все возможности есть.
—
5.2. ИНСТРУКЦИИ ПОИСКОВЫМ РОБОТАМ
- [R-001-001]. Наличие запрета на индексирование веб страницы сайта донора
- [R-001-002]. Наличие запрета на индексирование веб-страницы сайта донора в тэге META
- [R-001-003]. Наличие запрета на индексирование участка веб страницы включающего анализируемую ссылку
- [R-001-004]. Наличие запрета на индексирование какого-либо участка веб страницы
- [R-001-005]. Наличие запрета на переход поисковой системе в виде «nofollow» для данной ссылки
- [R-001-006]. Наличие запрета на переход поисковой системе используя атрибут rel=»nofollow» для какой-либо ссылки на странице
- [R-002-001]. Наличие файла Robots.txt у сайта реципиента
- [R-002-002]. Наличие инструкций на запрет индексирования на странице сайта реципиента.
5.3. ПРОИСХОЖДЕНИЕ И НАПРАВЛЕНИЕ ССЫЛКИ
- [S-001-001]. Наличие сайта реципиента в списке доверенных доменов.
- [S-001-002]. Наличие сайта реципиента в черном списке.
- [S-002-001]. Сайт-донор и сайт-реципиент имеют общего владельца.
- [S-003-001]. Ссылка указывает на корневую страницу сайта.
- [S-003-002]. Ссылка находится в блоке ссылок указывающих на главные страницы сайтов.
5.4. АНАЛИЗ СТРУКТУРЫ ВЕБ-СТРАНИЦЫ
- [L-001-001]. Значения атрибутов id и class ссылки в черном списке.
- [L-001-002]. Встречаемость ссылки более N раз на веб странице.
- [L-001-003]. Размер блока внешних ссылок.
- [L-002-001]. Местораcположение ссылки в конце страницы.
- [L-002-002]. Местораcположение ссылки по отношению к рекламным блокам.
- [L-003-001]. Превышение критической массы окружающих SEO ссылок.
- [L-003-002]. Использование средств сокрытия внешнего вида ссылок.
- [L-004-001]. Наличие специальных рекламных меток.
- [L-004-002]. Соответствие блока ссылок типовым шаблонам блоков SEO ссылок
5.5. АНАЛИЗ ТЕКСТА ССЫЛКИ И СТРАНИЦЫ
- [T-002-001]. Текст ссылки идентичен ссылке.
- [T-002-002]. Текст ссылки идентичен домену ссылки.
- [T-002-003]. Текст ссылки идентичен части ссылки.
- [T-002-004]. Транслитерированный текст ссылки идентичен части ссылки
- [T-003-001]. Текст ссылки содержит слова из чёрного списка.
- [T-003-002]. Текст ссылки содержит слова из белого списка.
- [T-003-003]. Текст обрамляющий ссылку подпадает под типовые шаблоны продвижения.
- [T-003-003]. Ссылка установлена на ключевые слова при наличии в тексте вне ссылки, рядом, её пути.
- [T-003-005]. Высокая плотность перечислений в тексте ссылки.
5.6. АНАЛИЗ МЕТОК ОТНОШЕНИЙ И СТРУКТУРЫ ВЕБ-САЙТОВ
- [E-001-001]. Является ли сайт реципиент блогом.
- [E-001-002]. Является ли сайт-реципиент государственным или некоммерческим ресурсом.
- [E-001-003]. Является ли сайт-реципиент коммерческим ресурсом.
- [E-002-001]. ТиЦ сайта-донора больше ТиЦ сайта-реципиента.
- [E-002-002]. Google PageRank сайта-донора больше Google PageRank сайта-реципиента.
- [E-002-004]. Нахождение ссылки в блоке ссылок с низким ТиЦ/PR по сравнению с анализируемой страницей.
- [E-002-003]. Посещаемость сайта-донора выше посещаемости сайта реципиента.
- [E-004-001]. Ссылка не указывает на HTML страницу.
- [E-004-001]. Совпадение тем сайтов донора и реципиента.
- [E-004-002]. Смысловое расстояние между темами сайтов донора и реципиента.
- [E-004-003]. Тематическая плотность ссылок в блоке внешних ссылок.
- [E-005-001]. Наличие у ссылки метрики отношения между сайтами донора и реципиента.
5.7. АНАЛИЗ ПОВЕДЕНИЯ ПОЛЬЗОВАТЕЛЕЙ И СПЕЦИАЛЬНЫЕ ПРОВЕРКИ
- [B-001-001]. Низкая “кликабельность” ссылки.
- [B-002-001]. Наличие ссылки на странице блога и отсутствие в RSS ленте
Поделиться в соц. сетях
Microsoft Translate
Рубрики
- BI (3)
- CEP (1)
- IBM (13)
- Novell (6)
- WTF (1)
- apple (3)
- blogging (61)
- couchdb (3)
- data.gov.ru (250)
- datasets (104)
- diagramming (11)
- e-Government (927)
- eGov (946)
- google (33)
- gtd (5)
- links (65)
- linux (19)
- microsoft (47)
- not so wtf yet (3)
- opengovdata.ru (198)
- opensource (56)
- productivity (2)
- saas (4)
- second life (2)
- security (6)
- semweb (15)
- sun (13)
- virtualization (16)
- vista (2)
- web (223)
- web 2.0 (108)
- wikileaks (1)
- yahoo (11)
- Без рубрики (4)
- Енот Поискун (17)
- Общественное благо (12)
- алгоритмы (73)
- алгоритмы (51)
- аналитика (19)
- антисео (5)
- бывает и такое (8)
- виртуализация (21)
- вопросы (20)
- госзаказ (172)
- идеи (29)
- из жизни (95)
- инновации (27)
- интересные проекты (7)
- информация (108)
- книги (2)
- метапост (1)
- открытое государство (51)
- открытые данные (10)
- поиск (93)
- почти несерьёзно (16)
- размышления (127)
- расшифровка реальности (10)
- робототехника (1)
- руководство проектами (3)
- скиур (19)
- социальные сети (45)
- социоранк (9)
- стандарты (22)
- стоит почитать (21)
- футуристика (1)
- электронное государство (945)
- юзабилити (25)
- юмор (14)
Метки
антиспам госзакупки гослюди госуслуги датасеты дебаты извлечение информации инновации кузьминов метаданные навальный открытое государство открытые данные поиск почти без иронии публичность раскрытие информации расшифровка реальности систематизация социоранг социоранк стартапы форматы файлов футуристика #belyh #rucamp #socamp 94-ФЗ antispam apps4russia icamp icamp2009 md5 ogp open government searchme semweb sha1 ssl usability






