Про поиск по картинкам и поиск Яндекса.
Смотрю обновлённый сервис Яндекса поиска по картинкам и думаю что конечно, поиск стал лучше, безусловно возможность искать картинки по всей сети, а не только в Рунете — это удобно. Но, инноваций тут прямо скажем очень мало, особенно в сравнении с идущими сейчас разработками в области распознавания изображений.
Поясню почему я так думаю. Единственные отличия Yandex’а от поиска изображений в Yahoo Image Search или Google Images. Отличий которые я вижу всего лишь два:
1. Определение доминирующего цвета картинки с возможностью его выбора
2. Автоматическое распознавание цвета по введённому его названию пользователем, например, красный утюг возвращает картинки утюгов красного цвета.
А вот поиск выделенно по фотографиям не работает, мне на все запросы выдавалось не более 50% картинок являющихся фотографиями, всё остальное рисунки и иже с ними.Имхо, подход несколько неверный по сути выдачи результатов. Фотографии можно отделять не по анализу содержимого, а по сайтам их хостинга индексируя специализированные фото-сайты.
Но дело даже не в этом. Возьмём к примеру не столь известный как Yahoo или Google — Exalead Images. Сейчас у них в бета тестировании находится возможность поиска по содержимому, на сегодняшний день, это только лица, но этот поиск реально работает. Лица возвращаются хотя бы в 70% случаев. Конечно интересно было бы оценить показатели ошибок первого и второго рода — неправильную классификацию и пропуск нужного изображения, но даже 70% это хороший показатель.
Есть IBM iMars бывший MARVEL, из всех разработок анализа шаблонов изображений это сейчас наиболее эффективная реализация. А ведь, по сути, IBM достаточно интегрировать iMars в их совместный с Yahoo проект — Omnifind и это уже будет наиболее инновационный механизм поиска по изображениям и видео из всех имеющихся. Скептики, конечно, могут возразить что анализ шаблонов изображений ресурсоёмок, но, на самом деле учитывая продолжающийся рост процессорных мощностей и выгоды которые из этого извлекают компании производители процессоров — все на рынке заинтересованы в проектах требующих лучших аппаратных ресурсов. Единственное ограничение — это лишь помещения и электроэнергия.
Из интересных продуктов на ту же тему стоит выделить Idee Piximilar, Multicolor Search Lab и разработку компании Active Symbols под названием EyeaLike
P.S.:
Уже к концу записи нашёл выступление Антона Носика на сайте Коммерсанта. Оказывается Last.fm работает над распознаванием музыки, чтож интересно, в остальном — малоинформативно. А вот насчёт того кто же предложит поиск по видео я готов поспорить что первыми будут IBM или IBM вместе с Yahoo. Или Google купит Idee Lab…
P.P.S.
Оказывается и у Google есть поиск с фильрацией по лицам. Согласно Arstechnica они приобрели компанию Neven Vision, которая на этом специализировалась, ещё в прошлом году. Но лица это только лица, ищут ведь не только их.
Поделиться в соц. сетях
Microsoft Translate
Рубрики
- BI (3)
- CEP (1)
- IBM (13)
- Novell (6)
- WTF (1)
- apple (3)
- blogging (61)
- couchdb (3)
- data.gov.ru (250)
- datasets (104)
- diagramming (11)
- e-Government (927)
- eGov (946)
- google (33)
- gtd (5)
- links (65)
- linux (19)
- microsoft (47)
- not so wtf yet (3)
- opengovdata.ru (198)
- opensource (56)
- productivity (2)
- saas (4)
- second life (2)
- security (6)
- semweb (15)
- sun (13)
- virtualization (16)
- vista (2)
- web (223)
- web 2.0 (108)
- wikileaks (1)
- yahoo (11)
- Без рубрики (4)
- Енот Поискун (17)
- Общественное благо (12)
- алгоритмы (73)
- алгоритмы (51)
- аналитика (19)
- антисео (5)
- бывает и такое (8)
- виртуализация (21)
- вопросы (20)
- госзаказ (172)
- идеи (29)
- из жизни (95)
- инновации (27)
- интересные проекты (7)
- информация (108)
- книги (2)
- метапост (1)
- открытое государство (51)
- открытые данные (10)
- поиск (93)
- почти несерьёзно (16)
- размышления (127)
- расшифровка реальности (10)
- робототехника (1)
- руководство проектами (3)
- скиур (19)
- социальные сети (45)
- социоранк (9)
- стандарты (22)
- стоит почитать (21)
- футуристика (1)
- электронное государство (945)
- юзабилити (25)
- юмор (14)
Метки
антиспам госзакупки гослюди госуслуги датасеты дебаты извлечение информации инновации кузьминов метаданные навальный открытое государство открытые данные поиск почти без иронии публичность раскрытие информации расшифровка реальности систематизация социоранг социоранк стартапы форматы файлов футуристика #belyh #rucamp #socamp 94-ФЗ antispam apps4russia icamp icamp2009 md5 ogp open government searchme semweb sha1 ssl usability






