Для оценки того, насколько информация, получаемая при помощи поисковых инструментов, разнообразнее информации, получаемой из социальных сетей, ученые ввели особый индекс, рассчитываемый исходя из распределения количества кликов. Индекс был введен на основе определения информационной энтропии (меры неопределенности или непредсказуемости информации). Например, один клик на «Коммерсант» и девять кликов на «Ведомости» дают меньший индекс, чем пять кликов на каждый сайт. Чем меньше значение индекса, тем более «концентрирован» трафик. Чем индекс выше – тем более разнообразны сайты, которые посещает пользователь.
Исследователи проанализировали анонимную базу данных CNetS (Center for Complex Networks and Systems Research), в которой содержатся сведения о 100 000 поисковых запросах, совершенных между октябрем 2006 и маем 2010. Вначале ученые очистили сырые данные от трафика поисковых ботов, а затем посмотрели, куда в конечном счете приводит та или иная ссылка, пометив источник каждой из них тремя метками: search, social media, email. Оказалось, что характер трафика в трех разных категориях существенно разнится: информационная энтропия у трафика из поисковых систем выше, что означает его большее разнообразие.
Читать дальше.
Комментарии:
Авторизуйтесь, чтобы оставить отзыв