Посты за: Май, 2009

Ссылки на 30.05.2009. Датасеты и наборы данных

  • INRIA Datasets — большие коллекции изображений INRIA (1GB и 1.6GB)  собранные с Flickr
  • 1.5 миллиона небольших картинок — датасет который я уже упоминал, но менее интересным он от этого не становится (3.5 GB)
  • ImageNet.org — объединение WordNet и огромной базы в количестве 3,247,902 изображений и 5247 синсетов. Есть возможность запросить доступ

    Читать больше

Демократизация данных

В блоге Обамы появилась запись Democratizing Data —  где описано ничто иное как анонс data.gov

Этот анонс давно ожидался, и вот время настало и открытые данные стали неотъемлимой частью информационного присутствия государства в сети (в США).

Обратите также внимание на наличие ссылки — Suggest Dataset

Про то что в России

Читать больше

Ссылки: Алгоритмы и массивы данных

Министерство Энергетики, банки изображений и TinEye

Захожу я сегодня на новый сайт Министерства Энергетики, а поскольку я обычно просматриваю интересные сайты полностью хотя бы уровня до второго — вдруг что интересное, то и тут посмотрел внимательнее.

Про 8-ФЗ на этот раз не буду, они там даже ссылку на него разместили и это правильно.

Я на сей раз о

Читать больше

Инструменты работы с данными. Мысли и наблюдения

В последнее время много времени уделяю различным инструментам работы с информацией — очистка, обработка, конвертация, визуализация и всё что с этим связано. Общее число инструментов весьма велико, как и число их возможных применений.

Просуммирую собственные размышления:

  • большая часть инструментов работы с большими массивами информации написаны на Java. То же самое можно сказать

    Читать больше

Электронное Правительство

Пока я некоторое время пребывал в оффлайне произошла масса интересных событий. Прокомментирую хотя бы часть из них:

Новая программа «Электронное правительство»

Собственно новость на сайте правительства , я процитирую полностью и подчеркну самое интересное.

—-

Мы с вами посмотрим сегодня, как идет работа по федеральной целевой программе «Электронная Россия». Я не буду сейчас

Читать больше

Автоматическая классификация сайтов: возможные подходы

Ранее я упоминал про недавнее исследование из Яндекса — Автоматическая классификация веб сайтов (в PDF) и что лично я несогласен с подходом использующим классификацию по ключевым словам.  Главное — это то что у Яндекса как и других поисковых систем, на самом деле, куда больше информации о сайтах, пользователях и

Читать больше

Ближайшие личные планы

На днях мне говорили что в кризис это нестандартное решение, но с 21 числа я покидаю число наёмных работников.  Делаю это по собственной инициативе и главная причина в том что считаю что любая работа — это в первую очередь созидательная деятельность или лишь во вторую заработок денег только ради самих

Читать больше

Ссылки и документы: Анализ доклада ИНСОР и аналитическая записка Счетной Палаты

Хочу порекомендовать к прочтению Экспресс-анализ доклада ИНСОРа о «развитии электронного правительства в Российской Федерации» проведённый Виктором Гридиным и комментарии Екатерины Аксеновой в gov-gov.ru по рейтингу государственных сайтов.

От себя я добавлю что любой доклад, любой рейтинг или отчёт всегда вызывает недоверие при отсутствии данных на основе которых он строился.

Читать больше

Semantic Web for Dummies (Семантический Веб для Тупых)

На Амазоне вышла книжка Semantic Web for Dummies написанная Jeffry Pollock автором Adaptive Information (Адаптивная информация)  которая меня лично подвигла ко многим размышлениям на тему природы и свойств информации, равно как и её самоценности. Я лично пока полистал то что можно посмотреть в открытом доступе и, хотя книжка

Читать больше

Яндекс.Метрика