LSA
LSA (Latent Semantic Analysis) – это метод обработки и анализа текстовых данных, который помогает выявить скрытые семантические связи между словами. Иными словами, LSA – это способ понять, какие слова в тексте связаны между собой по смыслу.
LSI
LSI (Latent Semantic Indexing) – это метод анализа и индексирования текста, используемый для определения семантической связи между словами и понятиями в текстовых документах.
n-грамма
N-грамма – это последовательность из N слов в тексте. N может быть любым числом, и означает количество слов, которые объединяются вместе.
NLP
NLP (обработка естественного языка) – это технология машинного обучения, которая дает компьютерам возможность интерпретировать, обрабатывать и понимать человеческий язык.
NLTK
Natural Language Toolkit (NLTK) — библиотека для обработки естественного языка (NLP) на языке программирования Python.
Pragma
Заголовок “Pragma” используется в HTTP-запросах и ответах для передачи дополнительных инструкций связанных с кэшированием. Он обычно используется для определения поведения кэширования на уровне клиента или прокси-сервера.
RankBrain
RankBrain является компонентом системы ранжирования Google и основан на технологии машинного обучения. Алгоритм обрабатывает запросы пользователей и пытается понять их смысл, а не просто соотнести слова в запросе с определенными страницами
RDFa
RDFa, или Resource Description Framework in attributes (расширяемая разметка ресурсов в атрибутах), – это способ добавления структурированной информации к веб-страницам, чтобы помочь поисковым системам и другим приложениям понять и интерпретировать контент более эффективно.
RFC 1945
HTTP — протокол прикладного уровня передачи данных, изначально — в виде гипертекстовых документов в формате HTML
ScaNN
ScaNN – алгоритм Google, основанный на поиске по сходству векторов. В основе его лежит преобразование входных данных в многомерные векторы, эмбеддинги, благодаря которым для пользовательского запроса можно найти наиболее близкие эмбединги в базе данных.