Research output: Contribution to journal › Article › peer-review
Применение модифицированного алгоритма LSH для кластеризации внешнего окружения веб-пространства университетов. / Блеканов, Иван Станиславович; Корелин, Василий Николаевич; Сергеев, Сергей Львович.
In: НАУЧНО-ТЕХНИЧЕСКИЕ ВЕДОМОСТИ САНКТ-ПЕТЕРБУРГСКОГО ГОСУДАРСТВЕННОГО ПОЛИТЕХНИЧЕСКОГО УНИВЕРСИТЕТА. ИНФОРМАТИКА. ТЕЛЕКОММУНИКАЦИИ. УПРАВЛЕНИЕ, Vol. 229, No. 5, 2015, p. 79-87.Research output: Contribution to journal › Article › peer-review
}
TY - JOUR
T1 - Применение модифицированного алгоритма LSH для кластеризации внешнего окружения веб-пространства университетов
AU - Блеканов, Иван Станиславович
AU - Корелин, Василий Николаевич
AU - Сергеев, Сергей Львович
PY - 2015
Y1 - 2015
N2 - В работе проводится кластерный анализ внешних ресурсов сайтов крупных университетов. В качестве исследуемых объектов были выбраны сайты университетов России, США и Великобритании, занимающие в своих регионах ведущие позиции в вебометрическом рейтинге. Цель работы заключалась в выявлении для каждого сайта университета групп внешних веб-ресурсов с одинаковым родом деятельности. Проводился анализ найденных групп: определялась степень влияния количества и размеров этих групп на вебометрический рейтинг сайтов университетов. Для достижения поставленной цели авторами разработан алгоритм кластеризации, основанный на вероятностном методе понижения размерности многомерных данных (Locality-Sensitive Hashing – LSH). В работе ставился эксперимент, в котором на тестовых данных было показано, что алгоритм позволяет с высокой скоростью и допустимой точностью проводить кластеризацию большого объема данных. В заключении приводятся основные результаты исследования.
AB - В работе проводится кластерный анализ внешних ресурсов сайтов крупных университетов. В качестве исследуемых объектов были выбраны сайты университетов России, США и Великобритании, занимающие в своих регионах ведущие позиции в вебометрическом рейтинге. Цель работы заключалась в выявлении для каждого сайта университета групп внешних веб-ресурсов с одинаковым родом деятельности. Проводился анализ найденных групп: определялась степень влияния количества и размеров этих групп на вебометрический рейтинг сайтов университетов. Для достижения поставленной цели авторами разработан алгоритм кластеризации, основанный на вероятностном методе понижения размерности многомерных данных (Locality-Sensitive Hashing – LSH). В работе ставился эксперимент, в котором на тестовых данных было показано, что алгоритм позволяет с высокой скоростью и допустимой точностью проводить кластеризацию большого объема данных. В заключении приводятся основные результаты исследования.
UR - https://www.elibrary.ru/item.asp?id=24989953
M3 - статья
VL - 229
SP - 79
EP - 87
JO - НАУЧНО-ТЕХНИЧЕСКИЕ ВЕДОМОСТИ САНКТ-ПЕТЕРБУРГСКОГО ГОСУДАРСТВЕННОГО ПОЛИТЕХНИЧЕСКОГО УНИВЕРСИТЕТА. ИНФОРМАТИКА. ТЕЛЕКОММУНИКАЦИИ. УПРАВЛЕНИЕ
JF - НАУЧНО-ТЕХНИЧЕСКИЕ ВЕДОМОСТИ САНКТ-ПЕТЕРБУРГСКОГО ГОСУДАРСТВЕННОГО ПОЛИТЕХНИЧЕСКОГО УНИВЕРСИТЕТА. ИНФОРМАТИКА. ТЕЛЕКОММУНИКАЦИИ. УПРАВЛЕНИЕ
SN - 2304-9766
IS - 5
ER -
ID: 5819237