Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 11 2013 год

УДК: 004.912
Автоматическое контекстно-зависимое аннотирование текстовых документов
А. Ю. Чугунов, аспирант, Механико-математический факультет МГУ им. Ломоносова, e-mail: arcady.chugunov@gmail.com

Рассматривается актуальная задача контекстно-зависимого аннотирования текстовых документов с учетом поискового запроса пользователя. Приводится краткий обзор существующих работ по данной тематике, анализ их достоинств и недостатков. Рассматривается математическая модель аннотирования документов. Особое внимание уделяется методу спектрального оценивания лексических единиц текста, приводится соответствующий математический аппарат. Представлены результаты работы программной реализации алгоритма контекстно-зависимого аннотирования KGCDA на примере новостных публикаций. На основе полученных результатов сделаны выводы и сформулированы направления расширения функциональных возможностей выбранного для реализации алгоритма.

Ключевые слова: автоматическое аннотирование, документ, контекстно-зависимый подход, динамическое аннотирование, спектральные характеристики лексем, алгоритм Кенни-Гудмана
Стр. 39–46