Hadoop + HBase и корпоративный рынок.

Начитавшись про Hadoop, HBase и MapReduce я всё таки решился и по шагам их установил, проверил тестами из поставки +  собственной  небольшим срезом собственной коллекции  метаданных, около 100 MB суммарно.

Как итог могу сказать то, что сама задумка и реализация весьма толковая. Причём несмотря на то что сейчас эта связка сейчас в основном используется для работы с поисковыми индексами и для исследований и обработки огромных массивов метаданных, лично я вижу ещё как минимум ещё несколько серьёзных областей применения для корпоративного рынка.

Чуть ли не самая очевидная — это BI. Если поверх HBase  интегрировать один из OLAP движков, например, тот же Mondarian. В этом случае базы данных для DataWarehouse могут быть полностью перенесены в Hadoop + HBase, а формирование отчётов будет идти по кластеру из обычных компьютеров или достаточно слабых серверов.

Но это и только один из примеров. Точно также применение можно найти для анализа и обработки серверных логов (головная боль крупных провайдеров), биллинга и других задач.

Иначе говоря, моё мнение, технология созрела до корпоративного рынка и осталось совсем чуть-чуть когда начнут появляться первые решения.

About This Author

Яндекс.Метрика