Поиск Powerset — естественный язык и доверенные источники

Я уже упоминал его в ссылках, Powerset — это natural language search, обещают поиск по аналогии с тем что когда-то было у Ask.com. Казалось, бы идея то не сработала, самые популярные поисковики ничего такого не делают и ничего, доли не теряют.

Но кое-что там интересное всё же есть, Powerset ищут не по всему Веб-у, а только по ВикиПедии. Как следствие поисковые фразы возвращают весьма ограниченное число результатов с высокой точности. И, ещё один «шаг назад» — никакого PageRank и ему подобного. Поиск идёт по максимально точному совпадению фраз, а точнее массива ключевых/смысловых слов в поисковом запросе + анализ структуры запроса, возможно, лингвистический анализ его тематики.

В чём фокус и почему это может сработать:

1. Доверенные источники информации. — текущий единственный источник — Википедия, несмотря на многие упрёки в качестве информации, постоянно редактируется. Пожалуй нет ни одного такого коллаборативного проекта в Интернете сравнимого по уровню. Как следствие хотя и есть риск наличия некачественной информации, чаще это, всё же, отслеживается редакторами и исправляется. Отсюда малая вероятность «поискового продвижения» и замусоривания результатов. Далее, добавляя другие доверенные источники, можно обеспечить высокий уровень результатов поиска.

2. Естественный язык — хотя это и не панацея, но, при его развитие с учётом прогресса с использованием психолингвистики и формирование онтологии поисковых запросов, может привести к первым серьёзным шагам в понимании того чего же хочет найти пользователь.

3. Сужение ареала поиска — как следствие суждение чиста индексируемых источников, в результате пользователь получает лишь минимум результатов с высокой вероятностью их релевантности.

В общем-то Powerset не единственный такой проект, есть много как похожих, так и параллельных. Суть в самом понятии доверенный поиск построенном на доверии к тем информационным массивам которые они использует. И для разных ресурсов должны использоваться разные алгоритмы индексирования, ранжирования и структурного описания в зависимости от уровня доверия к ним.

About This Author

Яндекс.Метрика