Журнал "Программная инженерия"
Теоретический и прикладной научно-технический журнал
ISSN 2220-3397

Номер 10 2015 год

УДК: 004.9
Автоматическое построение функции оценке качества в задаче разрешения неоднозначности имен авторов научных публикаций
С. А. Афонин, канд. физ.-мат. наук, вед. науч. сотр., e-mail: serg@msu.ru, НИИ механики МГУ имени М. В. Ломоносова, А. Э. Гаспарянц, студент, e-mail: gaspariants@mail.ru, МГУ имени М. В. Ломоносова

Описан метод построения решающего правила для задачи автоматического разрешения неоднозначности имен авторов научных публикаций, основанный на методах машинного обучения. Предложен ряд эвристик, которые позволяют сократить время поиска решения. Результаты тестирования программного комплекса, проведенного на коллекции реальных данных, показали высокую эффективность и точность предлагаемого метода.

Ключевые слова: автоматическое обучение, классификация, электронная библиотека, библиографическая запись, имя автора, разрешение неоднозначности, поиск дубликатов
Стр. 31–37