Индекс тумана Ганнинга (или индекс фразовой туманности) – это метрика, используемая в лингвистике для измерения степени “туманности” или неопределенности выражений или фраз. Этот индекс позволяет оценить, насколько ясно или нечетко выражение передает свое значение или информацию.
Для вычисления индекса тумана Ганнинга анализируется структура и лексика выражения. Ученые выясняют, насколько выражение содержит неспецифичные или общие слова, использование косвенной речи, метафоры или двусмысленности. Важным фактором является также уровень конкретности и ясности выражения.
Индекс тумана Ганнинга рассчитывается с помощью следующего алгоритма:
Отобрать отрывок текста (например, один или несколько полных абзацев) примерно из 100 слов. Не пропускайте ни одного предложения;
Определить среднюю длину предложения. (Разделите количество слов на количество предложений.);
Подсчитать “сложные” слова, состоящие из трех или более слогов. Не включать имена собственные, жаргонизмы или составные слова;
Добавить среднюю длину предложения и процентное содержание сложных слов;
Умножить результат на 0,4.
Уровень качества = 0,4 (ASL + PHW)
где ASL = Средняя длина предложения (т. е. количество слов, деленное на количество предложений), а PHW = Процент трудных слов
Индекс тумана Ганнинга может быть числовым значением, отражающим уровень тумана выражения. Более высокое значение индекса указывает на большую степень нечеткости или многозначности выражения, в то время как более низкое значение означает большую ясность и определенность.
Индекс тумана обычно используется для подтверждения того, что текст может быть легко прочитан целевой аудиторией. Тексты для широкой аудитории подразумевают индекс тумана меньше 12. Для текстов, требующих всеобщего понимания, обычно требуется индекс меньше 8.
Хотя формула индекса Ганнинга тумана считается точной для удобочитаемости в английском языке, она имеет ряд недостатков. Например, не учитывается, что не все многосложные слова сложны.
Индекс туманности текста помогает лингвистам изучать, как мы используем язык, какие стратегии или структуры делают выражение менее ясным или более нечетким. Он также может помочь в оптимизации общения и понимания между разными группами людей, учитывая разные уровни языковой неопределенности или многозначности, чтобы избежать недоразумений и понятно изложить сообщение.
В SEO индекс тумана Ганнинга используется как вспомогательная метрика оценки текста и сопоставления его с заданным корпусом.