DBpedia
DBpedia – это важный инструмент для преобразования огромного массива информации из Википедии в формат, понятный и доступный для компьютеров.
DBSCAN
DBSCAN (Density-Based Spatial Clustering of Applications with Noise) – это алгоритм кластеризации, основанный на плотности. В отличие от K-means, где нужно заранее знать количество кластеров, DBSCAN находит их автоматически, группируя точки данных, которые расположены близко друг к другу.
DOM
DOM, или объектная модель документа — это спецификация программного интерфейса, который представляет HTML- или XML-документ в виде древовидной структуры, в котором каждый узел представляет собой объект, представляющий часть документа, например, заголовок, абзац, список, или ячейка таблицы.
Google Knowledge Graph
Google Knowledge Graph (Граф знаний Google) — это система, представленная Google в 2012 году, которая использует структурированные данные для предоставления более информативных и полезных результатов поиска.
HDBSCAN
HDBSCAN – это мощный алгоритм кластеризации, который основан на идее о том, что кластеры – это области высокой плотности, разделенные областями низкой плотности.
IRI
IRI – стандарт интернет-протокола , который основан на протоколе унифицированного идентификатора ресурса (URI) и значительно расширяет набор разрешенных символов благодаря использованию не US-ASCII, а большинство символов из универсального набора символов (Unicode/ISO 10646 ), включая китайские, японские, корейские и кириллические символы.
K-means
K-means – это популярный алгоритм машинного обучения, используемый для кластеризации данных.
LSA
LSA (Latent Semantic Analysis) – это метод обработки и анализа текстовых данных, который помогает выявить скрытые семантические связи между словами. Иными словами, LSA – это способ понять, какие слова в тексте связаны между собой по смыслу.
RankBrain
RankBrain является компонентом системы ранжирования Google и основан на технологии машинного обучения. Алгоритм обрабатывает запросы пользователей и пытается понять их смысл, а не просто соотнести слова в запросе с определенными страницами
SBERT
SBERT (Sentence BERT) – это модификация архитектуры BERT (Bidirectional Encoder Representations from Transformers), разработанная специально для генерации векторов фиксированной размерности, представляющих смысл целых предложений.