BERTopic
BERTopic – это современный алгоритм тематического моделирования, который использует мощь BERT-подобных моделей для извлечения тем из текстовых данных.
DBpedia
DBpedia – это важный инструмент для преобразования огромного массива информации из Википедии в формат, понятный и доступный для компьютеров.
GenAI
GenAI, или генеративный искусственный интеллект, – это подмножество технологий искусственного интеллекта, которые могут генерировать новые результаты на основе данных, использованных для обучения модели.
GPT
GPT – это нейронная языковая модель, которая может быть настроена на выполнение конкретной задачи путем применения к входному сигналу трансформаций, зависящих от задачи, что требует минимальных изменений в архитектуре модели.
NER
NER (Распознавание именованных ceoyjcntq) — это метод обработки естественного языка (NLP), который извлекает информацию из текста. NER включает в себя обнаружение и классификацию важной информации в тексте, известной как именованные сущности.
NLP
NLP (обработка естественного языка) – это технология машинного обучения, которая дает компьютерам возможность интерпретировать, обрабатывать и понимать человеческий язык.
OOV
OOV (Out-of-Vocabulary) – это термин, используемый в обработке естественного языка (NLP) и машинном обучении (ML) для обозначения слов, которые отсутствуют в словаре (вокабуляре) модели.
RAG
RAG (Retrieval Augmented Generation) – поисковая дополненная генерация, ипользующая дополнительную базу данных как дополнение к большой языковой модели (LLM) для повышения точности ответов, устранения галлюцинаций и увеличения производительности.
SBERT
SBERT (Sentence BERT) – это модификация архитектуры BERT (Bidirectional Encoder Representations from Transformers), разработанная специально для генерации векторов фиксированной размерности, представляющих смысл целых предложений.
Site2Vec
Site2Vec – мощная техника для изучения латентных представлений веб-сайтов на основе поведения пользователей.