DOI

The paper describes a process of clustering of article abstracts, taken from the largest bibliographic life sciences and biomedical information MEDLINE database into categories that correspond to types of medical interventions - types of patient treatments. Experiments were carried out to evaluate the quality of clustering for the following algorithms: K-means; K- means++; Hierarchical clustering, SIB (Sequential information bottleneck) together with the LSA (Latent Semantic Analysis) methods and MI (Mutual Information) which allow selecting feature vectors. Best results of clustering were achieved by K- means++ together with LSA then 210- dimensional space was chosen: Purity = 0.5719, Entropy = 1.3841, Normalized Entropy = 0.6299.

Язык оригиналаАнглийский
Название основной публикации2015 INTERNATIONAL CONFERENCE "STABILITY AND CONTROL PROCESSES" IN MEMORY OF V.I. ZUBOV (SCP)
РедакторыLA Petrosyan, AP Zhabko
ИздательInstitute of Electrical and Electronics Engineers Inc.
Страницы555-557
Число страниц3
ISBN (печатное издание)9781467376983
DOI
СостояниеОпубликовано - 2015
СобытиеIII Международная конференция "Устойчивость и процессы управления", посвященная 85-летию со дня рождения чл.-корр. РАН В.И. Зубова - Петергоф, St. Petersburg, Российская Федерация
Продолжительность: 5 окт 20159 окт 2015
http://www.apmath.spbu.ru/scp2015/openconf.php

конференция

конференцияIII Международная конференция "Устойчивость и процессы управления", посвященная 85-летию со дня рождения чл.-корр. РАН В.И. Зубова
Сокращенное названиеSCP 2015
Страна/TерриторияРоссийская Федерация
ГородSt. Petersburg
Период5/10/159/10/15
Сайт в сети Internet

ID: 3983135