Мешок слов (Bag of Words)
Алгоритм “Мешок слов” (BoW) – это один из способов представления текстовой информации в компьютерах. Текст разбивается на слова, а затем подсчитывается количество вхождений каждого слова в тексте.
Минимальное остовное дерево
Минимальное остовное дерево (MST) – это подграф графа, который соединяет все вершины при минимальной суммарной длине (весе) ребер и не содержит циклов.
Накрутка поведенческих факторов
Накрутка поведенческих факторов (ПФ) – это практика, при которой пытаются искусственно увеличить или изменить поведенческие метрики, учитываемые поисковыми алгоритмами при определении рейтинга веб-сайта.
Нейронное сопоставление
Нейронное сопоставление (Neural Matching) – это метод, который использует нейронные сети для сравнения и определения сходства между текстами или запросами.
ПейджРанк
ПейджРанк – это алгоритм ранжирования сайтов, разработанный компанией Google и используемый поисковой системой для оценки значимости страниц.
Поведенческие факторы
Поведенческие факторы в SEO оценивают действия пользователей на веб-сайте, которые могут повлиять на его ранжирование в поисковых результатах. Поисковые системы анализируют пользовательские сигналы для определения качества веб-страницы и ее релевантности для пользователей.
Поисковый спам
Поисковый спам (Search Engine Spam), также известный как SEO-спам, — это практика, при которой оптимизаторы пытаются манипулировать алгоритмами ранжирования, чтобы незаслуженно повысить позиции своих веб-страниц в результатах поиска.
Релевантность
Релевантность поиска — это показатель того, насколько тесно документ связан с запросом.
Скип-грамма
Скип-грамма – это метод машинного обучения без учителя, в котором центральное слово используется для предсказания окружающих. Модель используется в word2vec, связана с RankBrain, относится к одной из важнейших концепций NLP.
Скрытое распределение Дирихле (LDA)
Скрытое распределение Дирихле (LDA, Latent Dirichlet Allocation) – это вероятностная модель, используемая для анализа и кластеризации коллекций текстовых данных.