Результаты исследований: Научные публикации в периодических изданиях › статья › Рецензирование
МАРКОВСКИЙ МОМЕНТ ОСТАНОВКИ АГЛОМЕРАТИВНОГО ПРОЦЕССА КЛАСТЕРИЗАЦИИ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ. / Orekhov, A. V.
в: ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА. ПРИКЛАДНАЯ МАТЕМАТИКА. ИНФОРМАТИКА. ПРОЦЕССЫ УПРАВЛЕНИЯ, Том 15, № 1, 01.01.2019, стр. 76-92.Результаты исследований: Научные публикации в периодических изданиях › статья › Рецензирование
}
TY - JOUR
T1 - МАРКОВСКИЙ МОМЕНТ ОСТАНОВКИ АГЛОМЕРАТИВНОГО ПРОЦЕССА КЛАСТЕРИЗАЦИИ В ЕВКЛИДОВОМ ПРОСТРАНСТВЕ
AU - Orekhov, A. V.
PY - 2019/1/1
Y1 - 2019/1/1
N2 - При обработке больших массивов эмпирической информации или данных большой размерности кластерный анализ является одним из основных методов предварительной типологизации. Это обусловливает в том числе необходимость получения формальных правил для вычисления количества кластеров. В настоящее время наиболее распространенным методом определения предпочтительного числа кластеров является визуальный анализ дендрограмм, но такой подход сугубо эвристический. Выбор множества кластеров и момент завершения алгоритма кластеризации зависят друг от друга. Кластерный анализ данных из n-мерного евклидова пространства методом «одиночной связи» можно рассматривать как дискретный случайный процесс. Последовательности «минимальных расстояний» задают траектории этого процесса. Аппроксимационно-оценочный критерий» (approximation-estimating test) позволяет определить марковский момент, когда характер возрастания такой последовательности изменяется с линейного на параболический, что, в свою очередь, может быть признаком завершения агломеративного процесса кластеризации. Расчет количества кластеров является актуальной проблемой во многих случаях автоматической типологизации эмпирических данных, например в медицине при цитометрическом исследовании крови, автоматическом анализе текстов и в ряде других случаев, когда количество кластеров заранее неизвестно.
AB - При обработке больших массивов эмпирической информации или данных большой размерности кластерный анализ является одним из основных методов предварительной типологизации. Это обусловливает в том числе необходимость получения формальных правил для вычисления количества кластеров. В настоящее время наиболее распространенным методом определения предпочтительного числа кластеров является визуальный анализ дендрограмм, но такой подход сугубо эвристический. Выбор множества кластеров и момент завершения алгоритма кластеризации зависят друг от друга. Кластерный анализ данных из n-мерного евклидова пространства методом «одиночной связи» можно рассматривать как дискретный случайный процесс. Последовательности «минимальных расстояний» задают траектории этого процесса. Аппроксимационно-оценочный критерий» (approximation-estimating test) позволяет определить марковский момент, когда характер возрастания такой последовательности изменяется с линейного на параболический, что, в свою очередь, может быть признаком завершения агломеративного процесса кластеризации. Расчет количества кластеров является актуальной проблемой во многих случаях автоматической типологизации эмпирических данных, например в медицине при цитометрическом исследовании крови, автоматическом анализе текстов и в ряде других случаев, когда количество кластеров заранее неизвестно.
KW - Cluster analysis
KW - Least squares method
KW - Markov moment
KW - least squares method
KW - NUMBER
KW - cluster analysis
UR - http://www.scopus.com/inward/record.url?scp=85064714106&partnerID=8YFLogxK
UR - http://www.mendeley.com/research/markov-moment-agglomerative-method-clustering-euclidean-space
U2 - 10.21638/11702/spbu10.2019.106
DO - 10.21638/11702/spbu10.2019.106
M3 - статья
AN - SCOPUS:85064714106
VL - 15
SP - 76
EP - 92
JO - ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА. ПРИКЛАДНАЯ МАТЕМАТИКА. ИНФОРМАТИКА. ПРОЦЕССЫ УПРАВЛЕНИЯ
JF - ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА. ПРИКЛАДНАЯ МАТЕМАТИКА. ИНФОРМАТИКА. ПРОЦЕССЫ УПРАВЛЕНИЯ
SN - 1811-9905
IS - 1
ER -
ID: 41340292