OOV
OOV (Out-of-Vocabulary) – это термин, используемый в обработке естественного языка (NLP) и машинном обучении (ML) для обозначения слов, которые отсутствуют в словаре (вокабуляре) модели.
PAA
Последовательные запросы (PAA) – это последовательность поисковых запросов, которые пользователь выполняет в течение одной сессии, чтобы уточнить или расширить свой поиск. Они представляют собой путь пользователя от первоначального запроса до конечной информационной цели.
QBST
QBST (Query-Based Salient Terms), или “значимые термины на основе запросов”, — это методология анализа, которая выявляет наиболее важные и часто встречающиеся слова, фразы и сущности на страницах, занимающих топовые позиции в поисковой выдаче по конкретному запросу.
Query Fan-out
Query Fan-out — это метод «разветвления запросов», когда одновременно выполняется несколько связанных поисковых запросов по подтемам и различным источникам данных, а затем результаты объединяются для предоставления простого и понятного ответа.
RAG
RAG (Retrieval Augmented Generation) – поисковая дополненная генерация, ипользующая дополнительную базу данных как дополнение к большой языковой модели (LLM) для повышения точности ответов, устранения галлюцинаций и увеличения производительности.
SBERT
SBERT (Sentence BERT) – это модификация архитектуры BERT (Bidirectional Encoder Representations from Transformers), разработанная специально для генерации векторов фиксированной размерности, представляющих смысл целых предложений.
Site2Vec
Site2Vec – мощная техника для изучения латентных представлений веб-сайтов на основе поведения пользователей.
SMITH
SMITH — это модель ИИ, которая помогает Google лучше понимать объемный контент, анализируя целые документы, а не только отдельные предложения. В отличие от BERT, который фокусируется на понимании коротких предложений, SMITH предназначен для понимания длинных статей и документов.
t-SNE
t-SNE (t-distributed Stochastic Neighbor Embedding) – это алгоритм машинного обучения для визуализации и снижения размерности многомерных данных.
UMAP
UMAP (Uniform Manifold Approximation and Projection) — это мощный алгоритм снижения размерности, который позволяет визуализировать многомерные данные в пространстве меньшей размерности (обычно 2D или 3D)
