BERT
BERT – это модель глубокого обучения, которая обрабатывает и понимает естественный язык. Разработана для решения различных задач, связанных с обработкой текста, таких как вопросно-ответная система, классификация текста, заполнение пропусков и другие.
BERTopic
BERTopic – это современный алгоритм тематического моделирования, который использует мощь BERT-подобных моделей для извлечения тем из текстовых данных.
BM25
BM25 (Best Matching 25) – это алгоритм оценки и ранжирования релевантности документов в поисковых системах. Он был разработан Джо Баярдом и Трэвисом Хьюзом в 1994 году для улучшения алгоритма BM11.
BrowseRank
BrowseRank – это алгоритм ранжирования, в котором для определения значимости веб-страницы используются данные о поведении пользователей.
DBSCAN
DBSCAN (Density-Based Spatial Clustering of Applications with Noise) – это алгоритм кластеризации, основанный на плотности. В отличие от K-means, где нужно заранее знать количество кластеров, DBSCAN находит их автоматически, группируя точки данных, которые расположены близко друг к другу.
DomDistiller
DomDistiller – это базовый движок Chrome, используемый для очистки веб-страницы от второстепенных элементов и улучшающий машиночитаемость контента. Благодаря ему можно понять, как Google отделяет основной контент, читает и анализирует его.
DR
DR в SEO (Domain Rating) – это показатель авторитета домена, разработанный компанией Ahrefs. Он оценивает силу ссылочного профиля сайта по шкале от 0 до 100, где 100 – это максимально возможное значение.
E-E-A-T
E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness) — это набор критериев, которые Google использует для оценки качества веб-страниц и их контента.
FAISS
FAISS (Facebook AI Similarity Search) – это библиотека, разработанная Facebook AI Research, предназначенная для эффективного поиска ближайших соседей (nearest neighbor search) и кластеризации векторов в больших наборах данных
GenAI
GenAI, или генеративный искусственный интеллект, – это подмножество технологий искусственного интеллекта, которые могут генерировать новые результаты на основе данных, использованных для обучения модели.
