Невозможно решить проблему на том же уровне, на котором она возникла. Нужно стать выше этой проблемы, поднявшись на следующий уровень.
Альберт Эйнштейн
Как обещал пишу впечатления накопленные по конференции по госзакупкам и мои размышления по этой теме.
В качестве преамбулы — есть два больших заблуждения. Первое — [...]
Читая материалы по document-based и column-based базам данных наткнулся на довольно интересный проект Thrudbeng. Что его выделяет является надстройкой между условно-любым хранилищем, в частности над Amazon S3, а также что Thrudb может быть развёрнут на Amazon EC2.
А вот и статья где о Thrudb рассказывается в деталяхeng и, в принципе, задумка представляется более [...]
Хотя лично я всё это время оставался скептиком поглощения Yahoo! со стороны Microsoft, тем не менее последние события и то что Yahoo! решились на сделку с Google по показу их рекламы, на мой взгляд, предрешает судьбу компании.
Даже несмотря на то что Microsoft всё ещё интересуется поисковым бизнесом Yahoo! — это скорее показатель того [...]
Хотел написать по теме длинно и пространно и бросил эту затею, много времени оно не стоит.
В итоге решил изложить мысли коротко и тезисно.
1. Доменные зоны .ru и .su, мягко, говоря себя ещё не исчерпали и практическая необходимость в кириллических доменах отсутствует.
2. Фильтры на прокси серверах, IDS и вырезалки баннеров не адаптированы для [...]
Отличный ролик на YouTube показывающий что такое social media — http://www.youtube.com/watch?v=MpIOClX1jPE
А производит такие ролики Common Craft — у них же есть ролики на тему блогов, RSS, подкастига и так далее.
Machine Learning (Theory) — групповой блог сотрудников Yahoo по машинному обучению. RedMonk — сайт и блоги аналитиков RedMonk. Один из лучших источников новостей и их анализа в мире пересечения корпоративного рынка и Open Source MSDN: Brian Jones (Open XML) - в основном пишет об Open XML, но в последнее время и про [...]
Не так давно читая материалы по Apache UIMA (Unstructured Information Management applications) я удивлялся зачем нужно такое переусложнение? Да и форма подачи документации UIMA, простоты не подразумевает, для любых частных задач проще создать частный анализатор и использовать его, а UIMA — это большая и сложная система. Разработки из IBM в принципе, по моим ощущением, [...]
Может быть интересно для тех кто работает над определением гео-расположением веб сайтов — выкладываю небольшой датасет в 5000 ресурсов в зонах .ru и .su. Он доступен по ссылке — http://urlus.ru/static/research/ru_5000.csv.gz (37 KB)
Структура CSV файла:
1. домен 2-го уровня
2. уровень гео-метки: 0 — отсутствует, 2 — город, 1 — регион, [...]
Углубившись в тему ещё немного убеждаюсь что в ней как и во многих других классификационных задачах популярны заблуждения приводящие к неверным выводам.
Так назначение гео-меток — это не только поиск географических названий, это ещё и анализ принципиальной и смысловой возможности этого назначения.
Рассмотрим пример. Василий Пупкин блоггер недавно переехавший из Москвы в Сидней пишет на [...]
Infoworld. The shrinking Java tools market — инструментов для Java платформы всё ещё много, но уже становится меньше чем раньше. New Wares Bridge Java and .NET — всё больше инструментов для связи Java и .NET продуктов. Платформы устоялись, заняли свои ниши и началась их связка. iCognue — The Next Generation Search [...]
Microsoft Translate
Рубрики
- BI (3)
- CEP (1)
- IBM (13)
- Novell (6)
- WTF (1)
- apple (3)
- apps4russia (1)
- blogging (61)
- couchdb (3)
- data.gov.ru (273)
- datasets (115)
- diagramming (11)
- e-Government (993)
- eGov (1012)
- google (33)
- gtd (5)
- links (65)
- linux (19)
- microsoft (47)
- not so wtf yet (3)
- opengovdata.ru (218)
- opensource (57)
- productivity (2)
- saas (4)
- second life (2)
- security (6)
- semweb (16)
- sun (13)
- virtualization (16)
- vista (2)
- web (223)
- web 2.0 (108)
- whenyouknowthereasonswhy (1)
- wikileaks (1)
- yahoo (11)
- Без рубрики (4)
- Енот Поискун (17)
- Общественное благо (13)
- алгоритмы (73)
- алгоритмы (51)
- аналитика (19)
- антисео (5)
- бывает и такое (8)
- виртуализация (21)
- вопросы (21)
- госзаказ (173)
- задачки (1)
- идеи (29)
- из жизни (95)
- инновации (27)
- интересные проекты (7)
- информация (108)
- книги (2)
- метапост (1)
- открытое государство (116)
- открытые данные (70)
- поиск (93)
- почти несерьёзно (16)
- размышления (128)
- расшифровка реальности (10)
- робототехника (1)
- руководство проектами (3)
- скиур (19)
- социальные сети (46)
- социоранк (9)
- стандарты (22)
- стоит почитать (21)
- футуристика (1)
- электронное государство (1016)
- юзабилити (25)
- юмор (15)
Метки
антиспам госзакупки гослюди госуслуги датасеты дебаты извлечение информации инновации кузьминов метаданные навальный открытое государство открытые данные поиск почти без иронии публичность раскрытие информации расшифровка реальности систематизация социоранг социоранк стартапы форматы файлов футуристика #belyh #rucamp #socamp 94-ФЗ antispam apps4russia icamp icamp2009 md5 ogp open government searchme semweb sha1 ssl usability


