Исследование модулярности Web-графа сайта

Вебометрика - раздел информатики, посвященный изучению количественных аспектов конструирования и использования информационных ресурсов, структур и технологий применительно к Всемирной паутине. Основными структурами изучения вебометрики являются веб-сайты. Структуру веб-сайта можно представить через его веб-граф - ориентированный граф, вершинами которого являются документы, а дугами гиперссылки между ними. В данной работе решается задача сравнения тематически близких сайтов в плане схожести по раздробленности структуры на сообщества через меру модулярности и анализ векторов модулярности их веб-графов. Для построения веб-графов сайтов была разработана программа-краулер (англ. crawler) RCCrawler. Поэтому в работе также рассматриваются проблемы краулинга - процесса следования по страницам сайта через гиперссылки, полученные с других страниц и внесенные пользователям вручную, с целью сбора определенной информации, статистики или сохранения ресурсов сайта. Для получения окончательных выводов был произведен кластерный анализ построенного множества векторов модулярности.

Общественные науки в целом
Дипломы

Вуз: Санкт-Петербургский государственный университет (СПбГУ)

ID: 587d36345f1be77c40d58945
UUID: 65f9ebf0-04c8-42ed-b2a9-297dc45cf128
Язык: Русский
Опубликовано: больше 7 лет назад
Просмотры: 159

Ланкин Александр Валерьевич

Источник: Санкт-Петербургский государственный университет


0

Комментировать 0

Рецензировать 0

Скачать - 2907024 bytes


Поделиться работой
Current View

Рецензии:

  Авторизуйтесь, чтобы добавить рецензию

- у работы пока нет рецензий -

Для лиц старше 18 лет