IRI означает интернационализированный идентификатор ресурса (Internationalized Resource Identifier). В пространстве RDF IRI используются как «имена» или эквиваленты «ID» для узлов графа. IRI – стандарт интернет-протокола , который основан на протоколе унифицированного идентификатора ресурса (URI) и значительно расширяет набор разрешенных символов благодаря использованию не US-ASCII, а большинство символов из универсального набора символов (Unicode/ISO 10646 ), включая китайские, японские, корейские и кириллические символы.
IRI, используемые в популярных онтологиях , очень похожи на большинство привычных нам URL-адресов. IRI — это последовательность символов из универсального набора символов (Unicode/ISO10646). Существует сопоставление IRI с URI, что означает, что IRI можно использовать вместо URI, где это необходимо, для идентификации ресурсов.
IRI определяются как надмножество URL-адресов (каждый URL-адрес является IRI, но не наоборот) и имеют одинаковую структуру со схемами (например, «http»), путями и фрагментами. Основное отличие состоит в том, что IRI могут содержать символы, нечасто используемые в английском языке, но встречающиеся в других языках (следовательно, «интернационализированные»), например é, ü или ç.
Интернационализация URI важна, поскольку URI могут содержать все виды информации из всех видов протоколов или форматов, в которых используются символы за пределами ASCII. Синтаксис URI, определенный в RFC 2396, в настоящее время допускает только подмножество ASCII, около 60 символов. Он также определяет способ кодирования произвольных байтов в символы URI: %, за которым следуют две шестнадцатеричные цифры.
Почему IRI используются для представления идентификаторов узлов в RDF
Предположим, у вас есть сайт «www.example.com». Вы можете построить график знаний с помощью IRI, например «http://www.example.com/person_alice», и иметь информацию о каждом предмете (здесь: Алиса), доступную в Интернете по одному и тому же адресу.
Это идея, лежащая в основе «Семантической сети», концепции, фокусируется на создании прямой связи между данными, хранящимися в базах данных и доступными в Интернете. При этом следование этим практикам не обязательно для создания эффективных интеллектуальных приложений с графовыми базами данных.