В работе проводится кластерный анализ внешних ресурсов сайтов крупных университетов. В качестве исследуемых объектов были выбраны сайты университетов России, США и Великобритании, занимающие в своих регионах ведущие позиции в вебометрическом рейтинге. Цель работы заключалась в выявлении для каждого сайта университета групп внешних веб-ресурсов с одинаковым родом деятельности. Проводился анализ найденных групп: определялась степень влияния количества и размеров этих групп на вебометрический рейтинг сайтов университетов. Для достижения поставленной цели авторами разработан алгоритм кластеризации, основанный на вероятностном методе понижения размерности многомерных данных (Locality-Sensitive Hashing – LSH). В работе ставился эксперимент, в котором на тестовых данных было показано, что алгоритм позволяет с высокой скоростью и допустимой точностью проводить кластеризацию большого объема данных. В заключении приводятся основные результаты исследования.
Язык оригиналарусский
Страницы (с-по)79-87
ЖурналНАУЧНО-ТЕХНИЧЕСКИЕ ВЕДОМОСТИ САНКТ-ПЕТЕРБУРГСКОГО ГОСУДАРСТВЕННОГО ПОЛИТЕХНИЧЕСКОГО УНИВЕРСИТЕТА. ИНФОРМАТИКА. ТЕЛЕКОММУНИКАЦИИ. УПРАВЛЕНИЕ
Том229
Номер выпуска5
СостояниеОпубликовано - 2015

ID: 5819237