LSH
LSH (Locality-Sensitive Hashing) — это локально-чувствительное хеширование. Это класс алгоритмов, которые хешируют объекты (векторы, строки, изображения) так, что похожие объекты с высокой вероятностью попадают в одну корзину (bucket), а непохожие — в разные.
LSI
LSI (Latent Semantic Indexing) – это метод анализа и индексирования текста, используемый для определения семантической связи между словами и понятиями в текстовых документах.
MD5
MD5 (Message Digest Algorithm 5) – это криптографическая хеш-функция, разработанная для создания 128-битного (16-байтного) хеша из данных любого размера.
Mustang
Алгоритм Google Mustang — основной механизм первичного скоринга, ранжирования и распределения веб-документов в поисковой выдаче Google.
MUVERA
MUVERA (Multi-Vector Retrieval via Fixed Dimensional Encodings) — это алгоритм многовекторного поиска, представленный Google Research в июне 2025 года для обработки сложных многовекторных запросов с высокой скоростью и точностью благодаря раздельному встраиванию слов из запроса и использованию одномерного поиска с максимальным скалярным произведением (MIPS).
Navboost
Navboost — важная система ранжирования Google, которая уточняет результаты поиска на основе навигационных взаимодействий пользователей
NLP
NLP (обработка естественного языка) – это технология машинного обучения, которая дает компьютерам возможность интерпретировать, обрабатывать и понимать человеческий язык.
PageRank
PageRank – это алгоритм, определяющий важность веб-страницы количеством и качеством ссылок, ведущих на нее.
Query Fan-out
Query Fan-out — это метод «разветвления запросов», когда одновременно выполняется несколько связанных поисковых запросов по подтемам и различным источникам данных, а затем результаты объединяются для предоставления простого и понятного ответа.
RAKE-NLTK
RAKE-NLTK – это реализация алгоритма RAKE на Python с использованием библиотеки NLTK.
