Релевантность документа запросу – это мера соответствия документа информационным потребностям пользователя, выраженным в поисковом запросе. Она определяет, насколько актуальным и полезным является документ для удовлетворения потребностей пользователя.
При поиске в поисковой системе пользователь вводит запрос, который может состоять из одного или нескольких ключевых слов или фраз. Задача поисковой системы – найти и предоставить наиболее релевантные документы, которые соответствуют запросу пользователя.
Релевантность — это одна из множества метрик, используемых в функции ранжирования, но одна из важнейших, зависящих от запроса, которые определяют, какие страницы входят в эталонный корпус.
Как поисковая система определяет релевантность
Поисковая система – представляет собой математическую среду, поэтому любая качественная характеристика должна быть определена с помощью количественного анализа. Это касается и расчёта релевантности как сложной многомерной метрики.
Любая поисковая система работает на модели векторного пространства. И запрос, и документы из списка поисковой выдачи представляются в виде векторов в многомерном пространстве. Векторы документов, наиболее близких к вектору запроса, рассматриваются как релевантные. Это чисто математическая операция, в которой мерой релевантности считается косинусное сходство.
Косинусное сходство измеряет косинус угла между двумя векторами в диапазоне от -1 до 1. -1 означает диаметральную противоположность. Ноль – отсутствие сходства. Результат 1 означает идентичность векторов.
На практике это означает, что с точки зрения поискового алгоритма значение имеют только количественные показатели, а не качественные. Иными словами, качественные метрики вторичны по отношению к количественным: экспертный статус автора, объём контента, дизайн оформления не определяют соответствие документа запросу.