Описана формализованная процедура исследования веб-сайта вебометрическими методами, включающая сбор данных о его структуре, построение и исследование веб-графа сайта, определение критерия «правильности» структуры сайта, определение управляющих воздействий для улучшения структуры сайта в смысле заданного критерия, проверка критерия на реальных примерах и разработка рекомендаций по улучшению структуры сайта. В качестве критерия оценки значимости страниц используется их Web PageRank (PR). Ценность страницы определяется по наличию (или отсутствию) ссылки на нее на главной странице сайта. Страница считается «ценной», если такая ссылка имеется. Критерий «правильности» структуры сайта определяется так: ценные страницы сайта должны иметь наивысший PR среди всех страниц сайта (главная страница считается ценной по умолчанию). Как управляющее воздействие рассматривается удаление директорий (с выделением их в самостоятельные сайты), имеющих в качестве корня страницы с высоким PR, но не являющиеся ценными. Проведенные экс
Язык оригиналаанглийский
Страницы (с-по)337-352
ЖурналВестник Санкт-Петербургского университета. Прикладная математика. Информатика. Процессы управления
Том15
Номер выпуска3
СостояниеОпубликовано - 2019
Опубликовано для внешнего пользованияДа

    Области исследований

  • data mining, graph, PageRank, universities, url, Web harvesting, web mining, website, website structure, веб-майнинг, веб-сайт, график, извлечение веб-данных, интеллектуальный анализ данных, структура веб-сайта, университеты

ID: 78394354