Посты в категории: google

Anti-Chrome: ToS WTF?

Говорят что на самом деле Тёмный Властелин

не погиб под Барад Дуром, а резко

уменьшился в росте и оброс шерстью.

По наводке в ToS для Chrome обнаружилось следующее:

11. Предоставляемая вами лицензия на Содержание

11.1. Вы сохраняете авторские (и любые другие принадлежащие вам) права на Содержание,

Читать больше

Google Begun

Reuters cообщает о том что зарегистрированная в Великобритании компания Рамблер.Медиа продала сервис  контекстной рекламы «Бегун» (ЗАО «Бегун») компании Google.

Про то как это хорошо для Гугла написали и пишут уже немало. Пусть Бегун и не самый удобный сервис, но клиентская база у него несомненно есть. Куда интереснее вопрос о том

Читать больше

Социальный тематический PageRank

Продолжая ударными темпами разбираться во математических внутренностях PageRank, TrustRank и прочих неконтентных алгоритмах, и ,решив выбрать упрощённую экспериментальную выборку, далее будут результаты нескольких моих экспериментов по расчёту аналога PageRank для Livejournal и аналога ТиЦ групп в блогах.

Как проходил эксперимент:

1. С помощью API ЖЖ была сформирована тестовая выборка в несколько тысяч

Читать больше

Бизнес vs. Политика

Я обычно стараюсь не писать о политике на страницах техноблога, но бывают темы настолько переплетённые с ИТ что не упоминуть их сложно.

ArsTechnica пишут пишут о Европейском аналоге Global Online Freedom Act, это закон регулирующий провайдеров, хостинговые компании и поисковые системы вводить какие-либо ограничения на доступ к своим ресурсам их

Читать больше

О распределённых поисковых машинах, Enabot и HyperTable

Весьма интересное в загадочном боте EnaBot (http://www.enaball.com/crawler.html) — это то, откуда он приходит — ec2-67-202-55-112.compute-1.amazonaws.com

А это не что иное как Amason EC2, не удивлюсь если при таком раскладе и база хранится в Amazon S3 и Amazon SimpleDB, наверняка не скажешь, но по логике и производительности это должно быть

Читать больше

PageRank, поисковики и зона доверия

Любопытные вещи выясняются если сравнивать рейтингование сайтов Yandex и Google.

Например, у Яндекса явный и сильный дисбаланс в сторону высоких рейтингов для онлайновых новостных изданий в то время как Google даёт высокие рейтинги государственным ресурсам практически во всех странах и в России тоже.

Не так давно я просматривал списки сайтов с наибольшими

Читать больше

Информация vs. Технологии

Я ранее уже писал о конкуренции между технологическими и информационными компаниями и, развивая тему, в чём же специфика этой конкуренции. Далее пойдут размышения, которые многим могут показаться банальными, но тем не менее.

На мой взгляд корень этой конкуренции в том что ИТ, в глобальном тренде, находится в период перелома

Читать больше

Продолжение рассуждений о Semantic Web и Linked Data

Если говорить о классических поисковых системах и наиболее распространенных поисковых алгоритмах, то неизбежно приходится возвращаться к PageRank или его аналогам. Причем не только для Web, но и для всех случаев связанных ссылками информационных массивов, например, базы научных работ. Особенность PageRank в том что ссылка в нём —

Читать больше

Размышления о поисковых системах

Случайно обнаружил явление что ссылки переданные через urlus.ru Гугл, почему-то, считает ссылками Урлуса. Например, поиск по сайт Минэкономразвития выдаёт второй ссылой ссылку в Урлусе на мой блог.  Учитывая что Урлус делает прямой HTTP редирект на внешний сайт, то Гугль видимо решил что они взаимосвязаны и проиндексировал страницу по

Читать больше

Некоторые наблюдения за поисковыми машинами. Жизнь ссылки

В последнее время, нечто вроде хобби, в свободное время анализом того как работают поисковые машины и их применимости семантическому вебу. И, также, моделями распространения информации. Одно из наблюдений — это время реакции поисковой машины на появление новой информации.

Быстро сделанный для этих целей мини-проект — Урлус (urlus.ru) который работает

Читать больше

Яндекс.Метрика