Говорят что на самом деле Тёмный Властелин
не погиб под Барад Дуром, а резко
уменьшился в росте и оброс шерстью.
По наводке в ToS для Chrome обнаружилось следующее:
…
11. Предоставляемая вами лицензия на Содержание
11.1. Вы сохраняете авторские (и любые другие принадлежащие вам) права на [...]
Любопытные вещи выясняются если сравнивать рейтингование сайтов Yandex и Google.
Например, у Яндекса явный и сильный дисбаланс в сторону высоких рейтингов для онлайновых новостных изданий в то время как Google даёт высокие рейтинги государственным ресурсам практически во всех странах и в России тоже.
Не так давно я просматривал списки сайтов с наибольшими ТиЦ и PageRank [...]
Reuters cообщает о том что зарегистрированная в Великобритании компания Рамблер.Медиа продала сервис контекстной рекламы «Бегун» (ЗАО «Бегун») компании Google.
Про то как это хорошо для Гугла написали и пишут уже немало. Пусть Бегун и не самый удобный сервис, но клиентская база у него несомненно есть. Куда интереснее вопрос о том как теперь Рамблер собирается [...]
Я ранее уже писал о конкуренции между технологическими и информационными компаниями и, развивая тему, в чём же специфика этой конкуренции. Далее пойдут размышения, которые многим могут показаться банальными, но тем не менее.
На мой взгляд корень этой конкуренции в том что ИТ, в глобальном тренде, находится в период перелома от ценности технологий к [...]
Продолжая ударными темпами разбираться во математических внутренностях PageRank, TrustRank и прочих неконтентных алгоритмах, и ,решив выбрать упрощённую экспериментальную выборку, далее будут результаты нескольких моих экспериментов по расчёту аналога PageRank для Livejournal и аналога ТиЦ групп в блогах.
Как проходил эксперимент:
1. С помощью API ЖЖ была сформирована тестовая выборка в несколько тысяч пользователей (6927).
2. [...]
Если говорить о классических поисковых системах и наиболее распространенных поисковых алгоритмах, то неизбежно приходится возвращаться к PageRank или его аналогам. Причем не только для Web, но и для всех случаев связанных ссылками информационных массивов, например, базы научных работ. Особенность PageRank в том что ссылка в нём — это просто ссылка. Она не несёт в [...]
Я обычно стараюсь не писать о политике на страницах техноблога, но бывают темы настолько переплетённые с ИТ что не упоминуть их сложно.
ArsTechnica пишут пишут о Европейском аналоге Global Online Freedom Act, это закон регулирующий провайдеров, хостинговые компании и поисковые системы вводить какие-либо ограничения на доступ к своим ресурсам их цензуру по факту обращения [...]
Случайно обнаружил явление что ссылки переданные через urlus.ru Гугл, почему-то, считает ссылками Урлуса. Например, поиск по сайт Минэкономразвития выдаёт второй ссылой ссылку в Урлусе на мой блог. Учитывая что Урлус делает прямой HTTP редирект на внешний сайт, то Гугль видимо решил что они взаимосвязаны и проиндексировал страницу по этому редиректу. Причём далее он [...]
Весьма интересное в загадочном боте EnaBot (http://www.enaball.com/crawler.html) — это то, откуда он приходит — ec2-67-202-55-112.compute-1.amazonaws.com
А это не что иное как Amason EC2, не удивлюсь если при таком раскладе и база хранится в Amazon S3 и Amazon SimpleDB, наверняка не скажешь, но по логике и производительности это должно быть быстрее чем держать свою распределённую [...]
В последнее время, нечто вроде хобби, в свободное время анализом того как работают поисковые машины и их применимости семантическому вебу. И, также, моделями распространения информации. Одно из наблюдений — это время реакции поисковой машины на появление новой информации.
Быстро сделанный для этих целей мини-проект — Урлус (urlus.ru) который работает укорачивателем ссылок по аналогии [...]
Microsoft Translate
Рубрики
- BI (3)
- CEP (1)
- IBM (13)
- Novell (6)
- WTF (1)
- apple (3)
- apps4russia (1)
- blogging (61)
- couchdb (3)
- data.gov.ru (273)
- datasets (115)
- diagramming (11)
- e-Government (993)
- eGov (1012)
- google (33)
- gtd (5)
- links (65)
- linux (19)
- microsoft (47)
- not so wtf yet (3)
- opengovdata.ru (218)
- opensource (57)
- productivity (2)
- saas (4)
- second life (2)
- security (6)
- semweb (16)
- sun (13)
- virtualization (16)
- vista (2)
- web (223)
- web 2.0 (108)
- whenyouknowthereasonswhy (1)
- wikileaks (1)
- yahoo (11)
- Без рубрики (4)
- Енот Поискун (17)
- Общественное благо (13)
- алгоритмы (73)
- алгоритмы (51)
- аналитика (19)
- антисео (5)
- бывает и такое (8)
- виртуализация (21)
- вопросы (21)
- госзаказ (173)
- задачки (1)
- идеи (29)
- из жизни (95)
- инновации (27)
- интересные проекты (7)
- информация (108)
- книги (2)
- метапост (1)
- открытое государство (116)
- открытые данные (70)
- поиск (93)
- почти несерьёзно (16)
- размышления (128)
- расшифровка реальности (10)
- робототехника (1)
- руководство проектами (3)
- скиур (19)
- социальные сети (46)
- социоранк (9)
- стандарты (22)
- стоит почитать (21)
- футуристика (1)
- электронное государство (1016)
- юзабилити (25)
- юмор (15)
Метки
антиспам госзакупки гослюди госуслуги датасеты дебаты извлечение информации инновации кузьминов метаданные навальный открытое государство открытые данные поиск почти без иронии публичность раскрытие информации расшифровка реальности систематизация социоранг социоранк стартапы форматы файлов футуристика #belyh #rucamp #socamp 94-ФЗ antispam apps4russia icamp icamp2009 md5 ogp open government searchme semweb sha1 ssl usability


