Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Том 7 Номер 1 2016 год

DOI: 10.17587/prin.7.3-13
УДК: 004.051; 004.912
Экспресс-анализ потоковых текстовых данных на предмет вхождения в них ключевых слов и фраз
В. А. Васенин, д-р физ.-мат. наук, проф., e-mail: vasenin@msu.ru, В. А. Роганов, ст. науч. сотр., e-mail: var@msu.ru, НИИ Механики МГУ имени М. В. Ломоносова, М. Д. Дзабраев, инженер, e-mail: dzabraew@gmail.com, НИИСИ РАН, г. Москва

Представлены результаты начального этапа исследований, в том числе предложенный авторами подход к решению задачи быстрого обнаружения ключевых слов и фраз в потоковых текстовых данных. Важной характеристикой при решении этой задачи является скорость работы программы-анализатора, которая должна обеспечивать обработку интенсивных потоков в режиме реального времени. Представлены примеры эффективных алгоритмов, решающих поставленную задачу.

Ключевые слова: Deep Packet Inspection, DPI, анализатор текста, детерминированный конечный автомат, недетерминированный конечный автомат, совершенная хэш-функция, технология CUDA
Стр. 3–13