Вопрос который я поднимал уже пару раз, но может быть что-то изменилось за последние полгода.
Учитывая род моей деятельности, да и общую большую склонность к систематизации чем идеегенерации — каждая идея приходящая в голову представляет ценность. Не все из них имеют коммерческое применение, некоторые просто из серии «может пригодится» или те что я периодически закидываю [...]
Что меня удивляло и продолжает удивлять так это так это нерасторопность поисковых машин, за исключением Google, в продвижении своих сервисов везде где только возможно.
Например, организация поиска по собственному сайту с помощью внешнего поисковика требует хоть и не слишком многих, но всё же усилий и хотя бы небольшого понимания HTML. Да и многие просто ленятся [...]
В копилку к идеям которые я уже размещал у себя на сайте предлагаю ещё одну которая в принципе подойдёт профильным изданиям по ИТ и Интернет бизнесу. Например, в Cnews, Roem, TelNews, WebPlanet и так далее.
Повысить интерес к сайту издания можно сравнительно просто — позволив пользователям заниматься осмысленными предсказаниями.
Вообще какие треды обсуждений новостей я [...]
Мысль пока не оформившаяся у меня в окончательное видение — пока только как идея и алгоритм выявления сплогов на блогоплатформах (LJ, Blogger или Community Server) с одной стороны блокирующая спам боты с другой подталкивающая пользователей к активности.
1. Введение на блогоплатформах системы рейтингов а ля СоциоРанк основанных доверии и активности уже зарегистрированных участников плюс расширение [...]
Что такое ветер — это небо.
Юрий Шевчук
Вопрос — что такое слово? Обычное слово, в предложении, суть буквы и ничего более. Конечно слово — это часть речи, может быть представлено родом и склонением, глаголы имеют спряжения и так далее. Рассмотрим слово и некоторые другие понятия с точки зрения [...]
Ранее я писал про работу с текстом и частотный анализ, например, то что при наличии первой и последней буквы и перемешанных остальных слово прочитать возможно. Несмотря на сомнения некоторых читателей, я всё же ещё раз хочу подтвердить — для того чтобы понимать слово, особенно в контексте, часто достаточно только первой и последней буквы и [...]
Два канадских учёных и историка пишут монографию — Programming History. При этом все материалы доступны онлайн http://niche.uwo.ca/programming-historian/index.php/Main_Page
Подход интересен — программирование приводится не как профессия, а как приготовление пищи по сборникам рецептов. А сами рецепты подбираются уже под специфичные узкие задачи.
Например, для историков: извлечение текстов, анализ частот слов, анализ слов в контексте, индексирование [...]
Anand Rajaraman (Ананд Раджаман) интересно пишет о том как использование большего числа данных «бьёт» более продвинутые алгоритмы More data usually beats better algorithms
Он приводит хороший пример с Adwords и его сравнение с Overture. По сути аукцион рекламы в Adwords не был чем-то революционно новым, в Overture это появилось гораздо раньше, важне [...]
Я периодически публикую записи о том как выявляются платные ссылки — это что-то вроде хобби, довольно непростая задача, со множеством весьма нетривиальных выводов, к счастью, в ней оказалось меньше необходимости в сложных мат. формулах, во всяком случае пока. На самом же деле смысл не в ссылках как таковых, ссылки следствие, а в глубоком анализе контента чего [...]
Начитавшись про Hadoop, HBase и MapReduce я всё таки решился и по шагам их установил, проверил тестами из поставки + собственной небольшим срезом собственной коллекции метаданных, около 100 MB суммарно.
Как итог могу сказать то, что сама задумка и реализация весьма толковая. Причём несмотря на то что сейчас эта связка сейчас в основном используется для [...]
Microsoft Translate
Рубрики
- BI (3)
- CEP (1)
- IBM (13)
- Novell (6)
- WTF (1)
- apple (3)
- apps4russia (1)
- blogging (61)
- couchdb (3)
- data.gov.ru (273)
- datasets (115)
- diagramming (11)
- e-Government (993)
- eGov (1012)
- google (33)
- gtd (5)
- links (65)
- linux (19)
- microsoft (47)
- not so wtf yet (3)
- opengovdata.ru (218)
- opensource (57)
- productivity (2)
- saas (4)
- second life (2)
- security (6)
- semweb (16)
- sun (13)
- virtualization (16)
- vista (2)
- web (223)
- web 2.0 (108)
- whenyouknowthereasonswhy (1)
- wikileaks (1)
- yahoo (11)
- Без рубрики (4)
- Енот Поискун (17)
- Общественное благо (13)
- алгоритмы (73)
- алгоритмы (51)
- аналитика (19)
- антисео (5)
- бывает и такое (8)
- виртуализация (21)
- вопросы (21)
- госзаказ (173)
- задачки (1)
- идеи (29)
- из жизни (95)
- инновации (27)
- интересные проекты (7)
- информация (108)
- книги (2)
- метапост (1)
- открытое государство (116)
- открытые данные (70)
- поиск (93)
- почти несерьёзно (16)
- размышления (128)
- расшифровка реальности (10)
- робототехника (1)
- руководство проектами (3)
- скиур (19)
- социальные сети (46)
- социоранк (9)
- стандарты (22)
- стоит почитать (21)
- футуристика (1)
- электронное государство (1016)
- юзабилити (25)
- юмор (15)
Метки
антиспам госзакупки гослюди госуслуги датасеты дебаты извлечение информации инновации кузьминов метаданные навальный открытое государство открытые данные поиск почти без иронии публичность раскрытие информации расшифровка реальности систематизация социоранг социоранк стартапы форматы файлов футуристика #belyh #rucamp #socamp 94-ФЗ antispam apps4russia icamp icamp2009 md5 ogp open government searchme semweb sha1 ssl usability


