Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 4 2013 год

УДК: 519.256
Проверка адекватности тематических моделей коллекции документов
A. А. Кузьмин, студент, Московский физико-технический институт, B. В. Стрижов, канд. физ.-мат. наук, науч. сотp., Вычислительный центр им. А. А. Доpодницына PАН, г. Москва,e-mail: strijov@ccas.ru

Рассматривается коллекция документов с экспертной тематической моделью. Для проверки адекватности экспертной модели предлагается построить алгоритмическую модель путем иерархической кластеризации коллекции текстов агломеративным и дивизимным способами. Определяется степень несоответствия экспертной модели и предлагаемой. Сравнивается качество моделей, полученных с помощью агломеративного и дивизимного алгоритмов. Визуализируются отличия полученной модели от экспертной.

Ключевые слова: коллекция документов, тематические модели, иерархические модели, кластеризация
Стр. 16–20
Работа выполнена при поддержке Министерства образования и науки РФ в рамках Государственного контракта 07.524.11.4002.