Metadata Analysis and Mining Application

Оказывается Opera разрабатывают  Metadata Analysis and Mining Application что буквально один в один то чем я занимаюсь (исследую возможности).

У них там больший упор на структуру, у меня на её смысловой анализ, построение объектной карты и онтологии связей.

Например, меня мало интересует частота слов в скриптах сайтах или размеры файлов, зато мои алгоритмы могут распознавать порядка 40 CMS и расширяютсяп под большее число по совокупности признаков и отделять навигационные ссылки от смысловых и «проплаченных».  Всяческая классификация сайтов — это отдельная, но связанная тема. Суммарно там очень много всего набирается сделать такой поисковик, в самом деле, не так уж сложно, особенно когда есть запас наработок по теме

Как бы то ни было, проект очень интересный, а для меня так особенно.

Моё мнение что создание такого поиска, а ещё правильнее, мета-базы веб страниц явной прибыли не принесёт, но определённо может помочь в создании проектов с коммерческими целями.

Главное, конечно, тут в понимании того для чего всё это нужно. Например, подозреваю что поиск инвестиций под подобный проект — дело бессмысленное.

About This Author

  • tynycatcaty

    Мне все же больше нравиться браузер Мозила, я даже видео по настройке Мозилы выставил вот тут — http://biz-inet.info/comment_1247931396.html . Пока лучшего браузера не встречал

Яндекс.Метрика