СоциоРанкинг, кластеры и выявление групп влияния

Ранее в нескольких записях я приводил примеры расчёта тематического PageRank’оподобного алгоритма, назовём его СоциоРанк, выявляющего основных инфлюэнсеров (участников наиболее влияющих на жизнь сообщества).

Но, если мы берём всё тот же Livejournal как тестовую выборку, то можно будет обратить внимание что общение происходит не в виде монологов, а в виде активных тематических дискуссий. Причём авторитетность автора инициатора дискуссии, зачастую не является решающей для её интенсивности / продолжительности и охвату участников, хотя и, безусловно, авторитетность автора значение имеет. Главное же что можно подметить — это наличие групп влияния, или мини-сообществ, кластеров взаимосвязь между участниками которых является одним из вероятностных факторов распространения и информации.

Например, для всех ранее рассчитанных тематических СоциоРанков сообществ, у меня сейчас есть расчёты и кластеров групп влияния, и сравнения двух этих показателей уже отличны. Участник даже с максимально высоким личным рангом, может быть частью кластера с уровнем влияния значительно ниже остальных. В то же время основные, наиболее интересные обсуждения, обычно генерируются и поддерживаются как раз группой с высоким суммарным и средним СоциоРанком.

Причём дальнейшие исследования помогают ответить на следующие вопросы:

1. Выявление и моделирование схем распространения информации.

2.  Определение групп влияния и предсказания их активностей.

3. Выявление «троллей», «спам-ботов» и участников с нулевой социальной активностью.

4. Перенос идей рейтинговой кластеризации из социальных сетей на другие области — индексирование веб страниц, индексы цитирования научных работ и так далее.

Если есть исследовательский интерес, могу закинуть несколько предрасчитанных кластеров и их рангов по любому ЖЖ сообществу.

About This Author

Яндекс.Метрика