Концепция TrustRank, или “рейтинг доверия”, была впервые представлена в совместном научном документе исследователей из Yahoo и Стэнфордского университета под названием “Борьба с веб-спамом с помощью TrustRank”. Основная цель этой технологии — не ранжирование сайтов в привычном понимании, а автоматическое выявление и фильтрация спамных страниц из общей массы интернет-ресурсов.
Метод, описанный в документе, является полуавтоматическим. Его работа строится на простом, но эффективном предположении: хорошие, авторитетные сайты редко ссылаются на спамные ресурсы. Процесс состоит из нескольких шагов. Сначала эксперты вручную отбирают небольшое количество “эталонных” или “начальных” страниц (seed sites), которые признаются абсолютно надежными. В оригинальном эксперименте для анализа значительной части интернета было достаточно менее 200 таких сайтов.
Затем алгоритм анализирует ссылочную структуру сети. Идея заключается в том, что доверие “передается” по ссылкам. Страницы, на которые ссылаются авторитетные ресурсы, с большей вероятностью также являются качественными. И наоборот, чем дальше страница находится от “эталонного” набора по цепочке ссылок, тем меньше доверия она получает. Таким образом, страницы, не имеющие связей с доверенным сегментом сети или находящиеся от него очень далеко, помечаются как потенциальный спам и могут быть отфильтрованы.
Использует ли Google технологию TrustRank
Вопреки распространенному мифу, Google не использует TrustRank, разработанный Yahoo. Путаница возникла из-за того, что оригинальный документ был опубликован на сайте Стэнфордского университета, с которым тесно связана история создания Google. Однако TrustRank — это технология, запатентованная компанией Yahoo, что защищает ее от прямого копирования другими компаниями.
Сам по себе TrustRank не является алгоритмом ранжирования. Он был создан как инструмент для отделения качественных страниц от спама, а не для определения, какая из качественных страниц лучше другой.
Какие аналогичные концепции есть у Google
Хотя Google не использует именно TrustRank, понятие “доверие” играет важную роль в его экосистеме. Однако оно реализуется через другие механизмы.
Во-первых, у Google есть собственный запатентованный подход, который также связан с доверием, но работает иначе. Он основан на создании пользовательских поисковых систем, где люди-эксперты отбирают и отмечают определенные сайты как авторитетные источники по конкретным темам. В рамках таких систем этим сайтам придается больший вес.
Во-вторых, понятие “доверие” (Trustworthiness) является ключевой частью концепции Google E-E-A-T, что расшифровывается как “Опыт, Экспертиза, Авторитетность и Достоверность” (Experience, Expertise, Authoritativeness, Trustworthiness). Эта концепция подробно описана в руководстве для асессоров (оценщиков качества поиска). Как заявлял представитель Google Бен Гомес, это руководство показывает, к чему должен стремиться поисковый алгоритм, а не описывает его работу напрямую. Таким образом, “Trustworthiness” в рамках E-E-A-T — это характеристика качества контента, которую Google хочет видеть в топе выдачи, а не конкретный алгоритм, подобный TrustRank.
Важно разделять эти понятия. TrustRank — это специфическая технология Yahoo для борьбы со спамом, основанная на передаче доверия от эталонных сайтов по ссылкам. Она не используется Google и не является алгоритмом ранжирования. В свою очередь, Google использует собственные, отличные от TrustRank, подходы для оценки авторитетности и достоверности ресурсов, главным из которых является ориентация на принципы E-E-A-T.