RDFa
RDFa, или Resource Description Framework in attributes (расширяемая разметка ресурсов в атрибутах), – это способ добавления структурированной информации к веб-страницам, чтобы помочь поисковым системам и другим приложениям понять и интерпретировать контент более эффективно.
RFC 1945
HTTP — протокол прикладного уровня передачи данных, изначально — в виде гипертекстовых документов в формате HTML
robots.txt
Robots.txt – это текстовый файл, который сообщает поисковым системам, какие страницы сайта им разрешено посещать и индексировать, а какие – нет.
ROI
Окупаемость инвестиций (ROI) — это финансовый показатель, который измеряет прибыльность инвестиций. Он рассчитывается как отношение чистой прибыли от инвестиций к их стоимости, выраженное в процентах.
SBERT
SBERT (Sentence BERT) – это модификация архитектуры BERT (Bidirectional Encoder Representations from Transformers), разработанная специально для генерации векторов фиксированной размерности, представляющих смысл целых предложений.
ScaNN
ScaNN – алгоритм Google, основанный на поиске по сходству векторов. В основе его лежит преобразование входных данных в многомерные векторы, эмбеддинги, благодаря которым для пользовательского запроса можно найти наиболее близкие эмбединги в базе данных.
Schema.org
Schema.org – это стандартизованный формат микроразметки, добавляющий структурированные данные к веб-страницам, чтобы помочь поисковым системам понять и интерпретировать контент более точно. Она использует набор тегов и атрибутов, которые добавляют дополнительную информацию о различных типах контента.
SEO
SEO, или Search Engine Optimization (поисковая оптимизация) – это комплекс мер, направленный на повышение позиций сайта в результатах выдачи поисковых систем (Яндекс, Google и др.) по определенным запросам пользователей.
SimHash
SimHash — это алгоритм, используемый для вычисления хешей похожих данных с целью сравнения текстовых или бинарных объектов по их схожести. Его основная задача — эффективно идентифицировать дубли и нечеткие дубли данных в больших коллекциях (например, страницы на сайте). SimHash применяется в задачах обработки текстов, борьбы с дублирующимся контентом и оптимизации хранения данных.
Site2Vec
Site2Vec – мощная техника для изучения латентных представлений веб-сайтов на основе поведения пользователей.