Анализ текста
Анализ текста – это техника машинного обучения, используемая для автоматического извлечения ценной информации из неструктурированных текстовых данных.
Бинарные метапризнаки
Бинарные метапризнаки — это дополнительные характеристики страницы или запроса, которые вы добавляете к эмбеддингу (вектору) вручную, чтобы помочь модели кластеризации учитывать то, что эмбеддинг сам не видит.
Векторная кластеризация
Векторная кластеризация в SEO — это метод автоматической группировки поисковых запросов и страниц сайта на основе их семантической близости в многомерном векторном пространстве, где вместо совпадения ключевых слов анализируется математическое расстояние между смысловыми эмбеддингами.
Векторные базы данных
Векторные базы данных – это особый тип баз данных, разработанный для эффективного хранения и поиска высокоразмерных векторов.
Генеративная модель
Генеративная модель – это тип модели машинного обучения, которая учится создавать новые данные, похожие на те, на которых она была обучена. Вместо того, чтобы просто классифицировать или предсказывать на основе входных данных, как это делают другие модели машинного обучения, генеративная модель учится лежащему в основе данных распределению вероятностей.
Глубокое обучение
Глубокое обучение – это набор алгоритмов и техник, вдохновленных работой человеческого мозга и называемых нейронными сетями.
Заземление
«Заземление» (grounding) — это процесс привязки ответов большой языковой модели (LLM) к реальным, проверяемым данным.
Именованные сущности
Именованные сущности (named entities) – уникальные объекты реального мира, такие как люди, организации, места, даты и т.д., которые могут быть обозначены уникальными именами. Сущности играют важную роль в обработке естественного языка и извлечении информации.
Колдунщик
Колдунщик – это информационный блок на поисковой выдаче, в который поисковая система выводит оптимальный и максимально точный ответ на запрос. Колдунщики формируются любой поисковой системой, способной искать как данные в веб вообще, так и специализированную информацию.
Контекст
Контекст в NLP – это информация, окружающая слово, фразу или текст, которая помогает определить их значение
