DOI

Usually, text documents are represented as a vector of n-dimensional Euclidean space. One of the main it the problem of the typology of texts using cluster analysis is to determine the number of clusters. In this article was researched the agglomerative clustering algorithm in Euclidean space. A statistical criterion for completing the clustering process was deriving as the Markov moment. Was considered the problem of cluster stability. As an example, it was considered retrieval of the harmful content.

Язык оригиналаАнглийский
Название основной публикацииInternet Science - INSCI 2018 International Workshops
Подзаголовок основной публикацииConference proceedings
РедакторыS.S. Bodrunova, et al.
ИздательSpringer Nature
Страницы19-32
ISBN (печатное издание)9783030177041
DOI
СостояниеОпубликовано - 2019
Событие5th International Conference on Internet Science, INSCI 2018: Internet in World Regions: Digital Freedoms and Citizen Empowerment - СПбГУ, Институт "Высшая школа журналистики и массовых коммуникаций", St. Petersburg, Российская Федерация
Продолжительность: 24 окт 201826 окт 2018
Номер конференции: 5th
http://insci2018.org/
http://insci2018.org

Серия публикаций

НазваниеLecture Notes in Computer Science
Том11551
ISSN (печатное издание)0302-9743
ISSN (электронное издание)1611-3349

конференция

конференция5th International Conference on Internet Science, INSCI 2018
Сокращенное название INSCI 2018
Страна/TерриторияРоссийская Федерация
ГородSt. Petersburg
Период24/10/1826/10/18
Сайт в сети Internet

    Предметные области Scopus

  • Теоретические компьютерные науки
  • Компьютерные науки (все)

    Области исследований

  • Cluster analysis, Clustering method, Least squares method, Euclidean space, Markov moment, Harmful content .

ID: 41713635