Макросемантика
Макросемантика – это анализ общих характеристик сети контента с точки зрения семантики.
Матрица
Матрица в NLP – это способ представления текстовых данных в виде таблицы с ячейками, которые хранят числовую информацию о словах или текстовых фрагментах.
Машинное обучение
Машинное обучение, или Machine Learning, это подраздел искусственного интеллекта, который относится к разработке компьютерных моделей, способных самостоятельно обучаться и делать прогнозы или принимать решения, основываясь на опыте или данных.
Метапоиск
Метапоисковые системы позволяют пользователям одновременно проводить поиск в нескольких различных поисковых системах.
Мешок слов (Bag of Words)
Алгоритм “Мешок слов” (BoW) – это один из способов представления текстовой информации в компьютерах. Текст разбивается на слова, а затем подсчитывается количество вхождений каждого слова в тексте.
Микросемантика
В лингвистике под микросемантикой принято понимать смысл отдельных языковых единиц (слов и словосочетаний) в отличие от макросемантики, имеющей отношение к смыслу всего текста.
Монолитный индекс
Монолитный индекс – это список ключевых слов (терминов), связанных с заданной страницей, и состоящий как из слов, содержащихся на самой странице (в документе), так и во внешних связанных источниках (текстах ссылок, около-ссылочном тексте и т.п.).