Как резюме предыдущих рассуждений — ускорение matching для регулярных выражений в 8-10 раз достижимо и зависимость времени далека от O(mn) и сильно зависит от содержимого коллекции выражений и потока данных, впрочем, это я уже упоминал. Осталось только довести прототип до ума, но сам он уже работает именно с такой производительностью.

В любом случае производительность превышает esmre и hachoir значительно. Точно оценить пока сложно, так как те работают только с упрощённым рег. выражениями, а мой алгоритм с любыми, но у него нет автоматизированного парсера для построения метрик. Пока нет.

Также пока ещё этот подход не универсален — так как универсальный механизм должен включать возможность построения разного рода индексов, оценки worst case, сбор статистики и так далее. Займусь ли я этим — незнаю, ибо задача хотя и интересная, но уже вне моего основного интереса по развитию Скиура

Поделиться в соц. сетях

Опубликовать в Google Plus
Опубликовать в LiveJournal
Опубликовать в Мой Мир
Опубликовать в Одноклассники