LSA
LSA (Latent Semantic Analysis) – это метод обработки и анализа текстовых данных, который помогает выявить скрытые семантические связи между словами. Иными словами, LSA – это способ понять, какие слова в тексте связаны между собой по смыслу.
LSI
LSI (Latent Semantic Indexing) – это метод анализа и индексирования текста, используемый для определения семантической связи между словами и понятиями в текстовых документах.
NLP
NLP (обработка естественного языка) – это технология машинного обучения, которая дает компьютерам возможность интерпретировать, обрабатывать и понимать человеческий язык.
PageRank
PageRank – это алгоритм, определяющий важность веб-страницы количеством и качеством ссылок, ведущих на нее.
RAKE-NLTK
RAKE-NLTK – это реализация алгоритма RAKE на Python с использованием библиотеки NLTK.
RankBrain
RankBrain является компонентом системы ранжирования Google и основан на технологии машинного обучения. Алгоритм обрабатывает запросы пользователей и пытается понять их смысл, а не просто соотнести слова в запросе с определенными страницами
SBERT
SBERT (Sentence BERT) – это модификация архитектуры BERT (Bidirectional Encoder Representations from Transformers), разработанная специально для генерации векторов фиксированной размерности, представляющих смысл целых предложений.
ScaNN
ScaNN – алгоритм Google, основанный на поиске по сходству векторов. В основе его лежит преобразование входных данных в многомерные векторы, эмбеддинги, благодаря которым для пользовательского запроса можно найти наиболее близкие эмбединги в базе данных.
Site2Vec
Site2Vec – мощная техника для изучения латентных представлений веб-сайтов на основе поведения пользователей.
SQL
SQL (Structured Query Language) – это язык программирования, используемый для работы с реляционными базами данных. Он позволяет создавать, изменять и управлять данными в таблицах базы данных.