Алгоритм выявления покупных ссылок. Часть 4. Вопросы

Размышляю о возможности раскрытия части алгоритма и исходного кода выявления платных ссылок о котором я писал ранее. Сам алгоритм состоит из двух частей — выявление ссылочных блоков и ранжирование найденных ссылок. В данном случае речь идёт о части с ранжированием.

Во-первых потому как уже есть понимание его текущих ограничений и как их обойти, но это займёт много времени на эксперименты. Если у меня будет время и желание ими заниматься.

Во-вторых хочеться услышать конструктивной критики читателей.

В-третьих алгоритм частично пересекается с публикацией Брайяна Дэвисона в 2000 году Recognizing nepotistic links in the Web.  Вообще попадись мне эта публикация раньше, было бы скучно возиться с этим самому, но нет, впервые я её увидел всего 3 дня назад и оказывается не зря я это делал — некоторые отличия, специфичные для Рунета, есть в моём алгоритме. Ещё больше отличий в его версии о которую я уже понимаю как сделать, но это, действительно, будет небыстрый процесс. 2-4 месяца.

И, наконец, в четвёртых алгоритм является весовым по принципу «обратного ранжирования», порог отсечения по которому поисковая машина принимает окончательное решение о том является ли ссылка платной или нет она может задать сама, алгоритм лишь укажет на наиболее вероятных кандидатов.

Окончательного решения у меня пока ещё нет и, в любом случае, какое-то время ещё займёт подготовка формализованного (научного) описания и извлечение исходного кода из контекста всего проекта, который к работе с платными ссылками никак не соотносился.

Вопросы:

1. Есть ли интерес  к подобным материалам у читателей?

2. Какую лицензию лучше выбрать для публикации, желательно с аргументами за?

About This Author

Яндекс.Метрика