Фев 12 2009

IBM iMars как сервис

Tag: IBM, инновацииivbeg @ 10:34 дп

IBM iMARS (Multimedia Analysis and Retrieval System) - исследовательский проект от IBM о котором я писал ранее один из весьма интересных и доступных публично проектов по автоматической классификации видео и изображений оказывается  что обновился в июне 2008 года, а также теперь доступен как веб-сервис в виде Feature Extraction Service for  IBM Multimedia Analysis and Retrieval System

Лично я попробовал несколько разных своих фотографий через онлайновый сервис и результаты скорее положительные – сервис успешно определяет сделана ли фотография в здании или вне его, наличие на фотографии людей и, не всегда точно, их пол. 

Я лично искренне надеюсь что в IBM продолжат эту разработку развивать и, когда-нибудь, сделают публично доступной если не в open-source, то хотя бы для открытой возможности пополнения классификаторов.


Апр 30 2008

Всё ли помнят слоны? История потерянных писем

В Arstechnica вышла замечательная статья о том как технологии влияют на жизнь и на политику в частности - An Elephant never forgets? George Bush missing emails

Если вкратце, то после прихода к власти Джорджа Буша младшего, вместе с ним пришли его люди и сменился практически весь персонал. Новая IT команда сразу же заменила работающую там систему Lotus Notes на Microsoft Exchange + Outlook, сломав использующуюся ранее систему резервного копирования писем и не имея для неё альтернатив.

Одновременно на серверах отсутствовали политики безопасности и любой имеющий к ним доступ мог удалить файлы / письма и невозможно было бы отследить кто и когда это сделал.

Результат этой истории – потеря как минимум 5 миллионов писем. При том что можно спорить и предполагать было ли это сделано осознанно или по причинам расхлябанности персонала, но в суд на администрацию Буша уже подали, а конгресс проводит своё расследование.
У меня такое чувство что более всех в этой ситуации выигрывает IBM, трудно придумать для Lotus Notes рекламу лучше, к тому же забесплатно.


Апр 23 2008

Ensemble Learning

Tag: IBM, алгоритмы, поискivbeg @ 10:31 дп

Продолжая тему участников Netflix Prize и алгоритмов вокруг конкурса – ещё один интересный блог A Beautiful WWW и несколько публикаций в нём посвящённых Ensemble Learning:

Смысл тот же о чём я писал в прошлом посте о размышлениях превосходстве данных над алгоритмами. Ensemble – это агрегация нескольких моделей в единое целое. Эдакий алгоритм над алгоритмами, как я понимаю это сейчас.

И много интересных  презентаций удалось найти на сайте  на ETech 2008 , в частности презентация по CouchDB показывает что проект оплачивается IBM и может получить активное развитие параллельно HBase.


Дек 13 2007

Про поиск по картинкам и поиск Яндекса.

Tag: IBM, web, поискivbeg @ 4:45 пп

Смотрю обновлённый сервис Яндекса поиска по картинкам и думаю что конечно, поиск стал лучше, безусловно возможность искать картинки по всей сети, а не только в Рунете – это удобно.  Но, инноваций тут прямо скажем очень мало, особенно в сравнении с идущими сейчас разработками в области распознавания изображений.

Поясню почему я так думаю. Единственные отличия Yandex’а от поиска изображений в Yahoo Image Search или Google Images. Отличий которые я вижу всего лишь два:

1. Определение доминирующего цвета картинки с возможностью его выбора

2. Автоматическое распознавание цвета по введённому его названию пользователем, например, красный утюг возвращает картинки утюгов красного цвета.

А вот поиск выделенно по фотографиям не работает, мне на все запросы выдавалось не более 50% картинок являющихся фотографиями, всё остальное рисунки и иже с ними.Имхо, подход несколько неверный по сути выдачи результатов. Фотографии можно отделять не по анализу содержимого, а по сайтам их хостинга индексируя специализированные фото-сайты.

Но дело даже не в этом. Возьмём к примеру не столь известный как Yahoo или Google – Exalead Images. Сейчас у них в бета тестировании находится возможность поиска по содержимому, на сегодняшний день, это только лица, но этот поиск реально работает.  Лица возвращаются хотя бы в 70% случаев. Конечно интересно было бы оценить показатели ошибок первого и второго рода – неправильную классификацию и пропуск нужного изображения, но даже 70% это хороший показатель.

Есть IBM iMars бывший MARVEL, из всех разработок анализа шаблонов изображений это сейчас наиболее эффективная реализация. А ведь, по сути, IBM достаточно интегрировать iMars в их совместный с Yahoo проект – Omnifind и это уже будет наиболее инновационный механизм поиска по изображениям и видео из всех имеющихся.  Скептики, конечно, могут возразить что анализ шаблонов изображений ресурсоёмок, но, на самом деле учитывая продолжающийся рост процессорных мощностей и выгоды которые из этого извлекают компании производители процессоров – все на рынке заинтересованы в проектах требующих лучших аппаратных ресурсов. Единственное ограничение – это лишь помещения и электроэнергия.

Из интересных продуктов на ту же тему стоит выделить Idee Piximilar,  Multicolor Search Lab  и разработку компании Active Symbols под названием EyeaLike

P.S.:

Уже к концу записи нашёл выступление Антона Носика на сайте Коммерсанта. Оказывается Last.fm работает над распознаванием музыки, чтож интересно, в остальном – малоинформативно. А вот насчёт того кто же предложит поиск по видео я готов поспорить что первыми будут IBM или IBM вместе с Yahoo. Или Google купит Idee Lab…

P.P.S.

Оказывается и у Google есть поиск с фильрацией по лицам. Согласно Arstechnica они приобрели компанию Neven Vision, которая на этом специализировалась, ещё в прошлом году. Но лица это только лица, ищут ведь не только их.


Ноя 11 2007

IBM «The end of advertising as we know it»

Tag: IBMivbeg @ 2:37 пп

На сайте IBM появился весьма любопытный отчёт/исследование о изменениях на рекламном рынке. В частности они пишут про появление в будущем интерактивной рекламы, рекламы посредством различных цифровых устройств и о том что рекламный рынок меняется от массового охвата всех и вся до сужения целевых аудиторий.

Мне интереснее всего почему именно IBM сейчас выступают с такими исследованиями. Бесспорно они один из активных рекламодателей,  но ведь наверняка дело не только в этом.

Прямые ссылки на PDF:


Сен 27 2007

iMARS и распознавание образов

Tag: IBM, инновацииivbeg @ 10:50 пп

Я ранее в двух постах писал про IBMовскую экспериментальную разработку MARVEL

К сожалению, его, как и многие другие исследовательские проекты IBM трудно отслеживать через RSS, поэтому периодически проверяю их вручную. Каково же было моё удивление когда я обнаружил что следы MARVEL на сайте IBM исчезли. Ссылка на проект благополучно возвращает 404 ошибку. В конце концов после детальных поисков обнаружилось что он не стал сверхсекретным и его не прикрыли, а всего лишь переименовали в iMARS – IBM Multimedia Analysis and Retrieval System.

Как бы то ни было сегодня натравил iMars на коллекцию фотографий и обнаружил сразу несколько изменений. Первое – повысилось качество распознавания. Если ранее на моей выборке было до 20% ошибок, то теперь только каждая 20 фотография классифицировалась неправильно.

Второе –   видно что активно идёт работа над новыми шаблонами распознавания. Повились шаблоны студий и толп.

Чем мне лично именно этот проект интересен так это что учитывая рост процессорных мощностей и качества распознавания изображений он вполне сможет заменить назначение тэгов через фолксономию. Сколько я ни смотрел аналогичного рода ПО нигде нет, только статьи и исследования. Очень интересно во что это выльется в итоге.


Сен 21 2007

Впечатления по Lotus Symphony

Tag: IBMivbeg @ 9:48 пп

Если уместить в пару слов – то впечатления «никакие». Да, есть приятные особенности в виде более быстрого запуска чем OpenOffice 2.2, но выход версии OO 2.3 эту особенность сводит на нет. Пропагандируемая IBM поддержка ODF, также есть в OpenOffice и даже в Microsoft Office, а вот поддержать OOXML в Symphony они всё же могли бы. Религия здесь не должна затмевать разум, в среде где будут существовать оба формата люди предпочтут OpenOffice или MS Office только потому как оба поддерживают оба формата.

На отсутствии поддержки открытия HTML файлов и что пока локализация только на английском внимание не акцентирую – это относительно легко может изменится.

А вот никакой интеграции с онлайновыми сервисами нет. Никакой. Похоже только ThinkFree об этом серьёзно задумываются.


Июл 06 2007

Датский проект по анализу совместимости ODF & OOXML

Датское агенство OIO ведающее предоставлением публичной информации государственными учереждениями стартовало проект по анализу совместимости продуктов с ODF и OOXML, а также их взаимосовместимость.
По ссылке уже доступны документы на датсокм с анализом форматов, совместимости продуктов и сравнения конвертеров.
Documentformaterdansk

К слову, большая часть текста понятна несмотря на датский язык.


Июл 05 2007

Коллекция презентаций по ODF & OOXML

Tag: IBM, links, microsoft, opensource, sun, из жизниivbeg @ 8:53 пп

Вдогонку к предыдущим про ODF и OOXML подборка презентаций по обоим форматам.
А вот материалов на русском оказывается не так уж много, презентаций точно.

OpenDocument (ODF)

  • An ODF Update – Robert Weir, IBM, 21 июня 2006 года
  • Fedict en Open Standaarden – Fedict en Open Standaarden, FeDict, апрель 2007 (на французском, обзор применимости ODF в Бельгии)

Open XML (OOXML)

Нейтральные точки зрения


Апр 24 2007

Экспресс обзор материалов по виртуализациина 24.04.2007

Tag: IBM, linux, virtualization, виртуализацияivbeg @ 1:29 пп

Следующая страница »


Rambler's Top100