GenAI
GenAI, или генеративный искусственный интеллект, – это подмножество технологий искусственного интеллекта, которые могут генерировать новые результаты на основе данных, использованных для обучения модели.
GPT
GPT – это нейронная языковая модель, которая может быть настроена на выполнение конкретной задачи путем применения к входному сигналу трансформаций, зависящих от задачи, что требует минимальных изменений в архитектуре модели.
NER
NER (Распознавание именованных ceoyjcntq) — это метод обработки естественного языка (NLP), который извлекает информацию из текста. NER включает в себя обнаружение и классификацию важной информации в тексте, известной как именованные сущности.
NLP
NLP (обработка естественного языка) – это технология машинного обучения, которая дает компьютерам возможность интерпретировать, обрабатывать и понимать человеческий язык.
OOV
OOV (Out-of-Vocabulary) – это термин, используемый в обработке естественного языка (NLP) и машинном обучении (ML) для обозначения слов, которые отсутствуют в словаре (вокабуляре) модели.
RAG
RAG (Retrieval Augmented Generation) – поисковая дополненная генерация, ипользующая дополнительную базу данных как дополнение к большой языковой модели (LLM) для повышения точности ответов, устранения галлюцинаций и увеличения производительности.
Анализ текста
Анализ текста – это техника машинного обучения, используемая для автоматического извлечения ценной информации из неструктурированных текстовых данных.
Глубокое обучение
Глубокое обучение – это набор алгоритмов и техник, вдохновленных работой человеческого мозга и называемых нейронными сетями.
Токен
Токен — это единица текста, которая намеренно сегментирована для эффективной обработки большой языковой моделью. Этими единицами могут быть слова, части слов, словосочетания или знаки пунктуации.
Эмбеддинги
Эмбеддинги – это способ представления слов или фраз в виде числовых векторов, которые используются компьютерными моделями для обработки естественного языка. Они позволяют компьютеру понимать и работать с семантическим значением слов.