В работе проводится кластерный анализ внешних ресурсов сайтов крупных университетов. В качестве исследуемых объектов были выбраны сайты университетов России, США и Великобритании, занимающие в своих регионах ведущие позиции в вебометрическом рейтинге. Цель работы заключалась в выявлении для каждого сайта университета групп внешних веб-ресурсов с одинаковым родом деятельности. Проводился анализ найденных групп: определялась степень влияния количества и размеров этих групп на вебометрический рейтинг сайтов университетов. Для достижения поставленной цели авторами разработан алгоритм кластеризации, основанный на вероятностном методе понижения размерности многомерных данных (Locality-Sensitive Hashing – LSH). В работе ставился эксперимент, в котором на тестовых данных было показано, что алгоритм позволяет с высокой скоростью и допустимой точностью проводить кластеризацию большого объема данных. В заключении приводятся основные результаты исследования.
Original languageRussian
Pages (from-to)79-87
JournalНАУЧНО-ТЕХНИЧЕСКИЕ ВЕДОМОСТИ САНКТ-ПЕТЕРБУРГСКОГО ГОСУДАРСТВЕННОГО ПОЛИТЕХНИЧЕСКОГО УНИВЕРСИТЕТА. ИНФОРМАТИКА. ТЕЛЕКОММУНИКАЦИИ. УПРАВЛЕНИЕ
Volume229
Issue number5
StatePublished - 2015

ID: 5819237