СоциоРанкинг, кластеры и выявление групп влияния
Ранее в нескольких записях я приводил примеры расчёта тематического PageRank’оподобного алгоритма, назовём его СоциоРанк, выявляющего основных инфлюэнсеров (участников наиболее влияющих на жизнь сообщества).
Но, если мы берём всё тот же Livejournal как тестовую выборку, то можно будет обратить внимание что общение происходит не в виде монологов, а в виде активных тематических дискуссий. Причём авторитетность автора инициатора дискуссии, зачастую не является решающей для её интенсивности / продолжительности и охвату участников, хотя и, безусловно, авторитетность автора значение имеет. Главное же что можно подметить — это наличие групп влияния, или мини-сообществ, кластеров взаимосвязь между участниками которых является одним из вероятностных факторов распространения и информации.
Например, для всех ранее рассчитанных тематических СоциоРанков сообществ, у меня сейчас есть расчёты и кластеров групп влияния, и сравнения двух этих показателей уже отличны. Участник даже с максимально высоким личным рангом, может быть частью кластера с уровнем влияния значительно ниже остальных. В то же время основные, наиболее интересные обсуждения, обычно генерируются и поддерживаются как раз группой с высоким суммарным и средним СоциоРанком.
Причём дальнейшие исследования помогают ответить на следующие вопросы:
1. Выявление и моделирование схем распространения информации.
2. Определение групп влияния и предсказания их активностей.
3. Выявление «троллей», «спам-ботов» и участников с нулевой социальной активностью.
4. Перенос идей рейтинговой кластеризации из социальных сетей на другие области — индексирование веб страниц, индексы цитирования научных работ и так далее.
Если есть исследовательский интерес, могу закинуть несколько предрасчитанных кластеров и их рангов по любому ЖЖ сообществу.
Поделиться в соц. сетях
Microsoft Translate
Рубрики
- BI (3)
- CEP (1)
- IBM (13)
- Novell (6)
- WTF (1)
- apple (3)
- blogging (61)
- couchdb (3)
- data.gov.ru (250)
- datasets (104)
- diagramming (11)
- e-Government (927)
- eGov (946)
- google (33)
- gtd (5)
- links (65)
- linux (19)
- microsoft (47)
- not so wtf yet (3)
- opengovdata.ru (198)
- opensource (56)
- productivity (2)
- saas (4)
- second life (2)
- security (6)
- semweb (15)
- sun (13)
- virtualization (16)
- vista (2)
- web (223)
- web 2.0 (108)
- wikileaks (1)
- yahoo (11)
- Без рубрики (4)
- Енот Поискун (17)
- Общественное благо (12)
- алгоритмы (73)
- алгоритмы (51)
- аналитика (19)
- антисео (5)
- бывает и такое (8)
- виртуализация (21)
- вопросы (20)
- госзаказ (172)
- идеи (29)
- из жизни (95)
- инновации (27)
- интересные проекты (7)
- информация (108)
- книги (2)
- метапост (1)
- открытое государство (51)
- открытые данные (10)
- поиск (93)
- почти несерьёзно (16)
- размышления (127)
- расшифровка реальности (10)
- робототехника (1)
- руководство проектами (3)
- скиур (19)
- социальные сети (45)
- социоранк (9)
- стандарты (22)
- стоит почитать (21)
- футуристика (1)
- электронное государство (945)
- юзабилити (25)
- юмор (14)
Метки
антиспам госзакупки гослюди госуслуги датасеты дебаты извлечение информации инновации кузьминов метаданные навальный открытое государство открытые данные поиск почти без иронии публичность раскрытие информации расшифровка реальности систематизация социоранг социоранк стартапы форматы файлов футуристика #belyh #rucamp #socamp 94-ФЗ antispam apps4russia icamp icamp2009 md5 ogp open government searchme semweb sha1 ssl usability






