INRIA Datasets — большие коллекции изображений INRIA (1GB и 1.6GB) собранные с Flickr 1.5 миллиона небольших картинок — датасет который я уже упоминал, но менее интересным он от этого не становится (3.5 GB) ImageNet.org — объединение WordNet и огромной базы в количестве 3,247,902 изображений и 5247 синсетов. Есть возможность запросить доступ к полной базе [...]
Пока я некоторое время пребывал в оффлайне произошла масса интересных событий. Прокомментирую хотя бы часть из них:
Новая программа «Электронное правительство»
Собственно новость на сайте правительства , я процитирую полностью и подчеркну самое интересное.
—-
Мы с вами посмотрим сегодня, как идет работа по федеральной целевой программе «Электронная Россия». Я не буду сейчас говорить [...]
В блоге Обамы появилась запись Democratizing Data — где описано ничто иное как анонс data.gov
Этот анонс давно ожидался, и вот время настало и открытые данные стали неотъемлимой частью информационного присутствия государства в сети (в США).
Обратите также внимание на наличие ссылки — Suggest Dataset
Про то что в России необходим аналогичный [...]
Ранее я упоминал про недавнее исследование из Яндекса — Автоматическая классификация веб сайтов (в PDF) и что лично я несогласен с подходом использующим классификацию по ключевым словам. Главное — это то что у Яндекса как и других поисковых систем, на самом деле, куда больше информации о сайтах, пользователях и их взаимодействии чем просто страницы [...]
MNIST dataset of handwritten digits — большой массив данных (датасет) написанных вручную цифр и сравнений алгоритма по их идентификации NEC Animal Dataset — датасет изображений фигурок животных в разных позах и ракурсах. ManyEyes Datasets — подборка датасетов от IBM ManyEyes «Автоматическая классификация web-сайтов» PDF — исследование из Яндекса по классификации веб [...]
На днях мне говорили что в кризис это нестандартное решение, но с 21 числа я покидаю число наёмных работников. Делаю это по собственной инициативе и главная причина в том что считаю что любая работа — это в первую очередь созидательная деятельность или лишь во вторую заработок денег только ради самих денег.
Выходить куда-либо на работу [...]
Захожу я сегодня на новый сайт Министерства Энергетики, а поскольку я обычно просматриваю интересные сайты полностью хотя бы уровня до второго — вдруг что интересное, то и тут посмотрел внимательнее.
Про 8-ФЗ на этот раз не буду, они там даже ссылку на него разместили и это правильно.
Я на сей раз о другом, простом, но [...]
Хочу порекомендовать к прочтению Экспресс-анализ доклада ИНСОРа о «развитии электронного правительства в Российской Федерации» проведённый Виктором Гридиным и комментарии Екатерины Аксеновой в gov-gov.ru по рейтингу государственных сайтов.
От себя я добавлю что любой доклад, любой рейтинг или отчёт всегда вызывает недоверие при отсутствии данных на основе которых он строился. Это можно сказать и [...]
В последнее время много времени уделяю различным инструментам работы с информацией — очистка, обработка, конвертация, визуализация и всё что с этим связано. Общее число инструментов весьма велико, как и число их возможных применений.
Просуммирую собственные размышления:
большая часть инструментов работы с большими массивами информации написаны на Java. То же самое можно сказать про инструменты работы [...]
На Амазоне вышла книжка Semantic Web for Dummies написанная Jeffry Pollock автором Adaptive Information (Адаптивная информация) которая меня лично подвигла ко многим размышлениям на тему природы и свойств информации, равно как и её самоценности. Я лично пока полистал то что можно посмотреть в открытом доступе и, хотя книжка для «Dummies», интересного там должно [...]
Microsoft Translate
Рубрики
- BI (3)
- CEP (1)
- IBM (13)
- Novell (6)
- WTF (1)
- apple (3)
- blogging (61)
- couchdb (3)
- data.gov.ru (250)
- datasets (104)
- diagramming (11)
- e-Government (925)
- eGov (944)
- google (33)
- gtd (5)
- links (65)
- linux (19)
- microsoft (47)
- not so wtf yet (3)
- opengovdata.ru (197)
- opensource (56)
- productivity (2)
- saas (4)
- second life (2)
- security (6)
- semweb (15)
- sun (13)
- virtualization (16)
- vista (2)
- web (223)
- web 2.0 (108)
- wikileaks (1)
- yahoo (11)
- Без рубрики (4)
- Енот Поискун (17)
- Общественное благо (12)
- алгоритмы (73)
- алгоритмы (51)
- аналитика (19)
- антисео (5)
- бывает и такое (8)
- виртуализация (21)
- вопросы (20)
- госзаказ (172)
- идеи (29)
- из жизни (95)
- инновации (27)
- интересные проекты (7)
- информация (108)
- книги (2)
- метапост (1)
- открытое государство (49)
- открытые данные (8)
- поиск (93)
- почти несерьёзно (16)
- размышления (127)
- расшифровка реальности (10)
- робототехника (1)
- руководство проектами (3)
- скиур (19)
- социальные сети (45)
- социоранк (9)
- стандарты (22)
- стоит почитать (21)
- футуристика (1)
- электронное государство (943)
- юзабилити (25)
- юмор (14)
Метки
антиспам госзакупки гослюди госуслуги датасеты дебаты извлечение информации инновации кузьминов метаданные навальный открытое государство открытые данные поиск почти без иронии публичность раскрытие информации расшифровка реальности систематизация социоранг социоранк стартапы форматы файлов футуристика #belyh #rucamp #socamp 94-ФЗ antispam apps4russia icamp icamp2009 md5 ogp open government searchme semweb sha1 ssl usability


