GenAI
GenAI, или генеративный искусственный интеллект, – это подмножество технологий искусственного интеллекта, которые могут генерировать новые результаты на основе данных, использованных для обучения модели.
Gensim
Gensim – это библиотека для анализа текстов и моделирования тем на языке программирования Python. Основная цель Gensim – работа с большими корпусами текста и разработка простых и эффективных алгоритмов для обработки и моделирования текстовых данных.
NLP
NLP (обработка естественного языка) – это технология машинного обучения, которая дает компьютерам возможность интерпретировать, обрабатывать и понимать человеческий язык.
NLTK
Natural Language Toolkit (NLTK) — библиотека для обработки естественного языка (NLP) на языке программирования Python.
RAG
RAG (Retrieval Augmented Generation) – поисковая дополненная генерация, ипользующая дополнительную базу данных как дополнение к большой языковой модели (LLM) для повышения точности ответов, устранения галлюцинаций и увеличения производительности.
ScaNN
ScaNN – алгоритм Google, основанный на поиске по сходству векторов. В основе его лежит преобразование входных данных в многомерные векторы, эмбеддинги, благодаря которым для пользовательского запроса можно найти наиболее близкие эмбединги в базе данных.
UIG
UIG – это то, в чем состоит дополнительная ценность вашего контента для поисковых систем и пользователей.
Глубокое обучение
Глубокое обучение – это набор алгоритмов и техник, вдохновленных работой человеческого мозга и называемых нейронными сетями.
Дистрибутивная семантика
Дистрибутивная семантика — это раздел математической лингвистики, который изучает значение выражений языка через их контекст употребления и распределение по различным контекстам.