Если вы когда-нибудь пробовали смотреть фильмы на иностранных языках, то наверняка замечали, что они звучат необычайно быстро. И это правда — во многих языках скорость речи разная. Портал popsci.com объяснил почему.
Результаты не удивляют, если задуматься о том, как мы говорим на этих языках. В английском языке много слогов, содержащих много звуков, тогда как в японском и многих других языках количество звуков на слог значительно меньше. То есть скорость произношения слогов в секунду выше. Если перевести статистику в цифры, то японский примерно на 20% быстрее английского, но люди, говорящие на этих языках, могут посмотреть фильм в дубляже с такой же продолжительностью. Отчасти это связано с творческим подходом к озвучиванию, но также дело в том, как два языка передают смысл.
В середине 20-го века американский эрудит Клод Шеннон внес большой вклад в математику, электротехнику и информатику благодаря своим работам по теории информации. Шеннон, придумавший термин «бит» для обозначения единицы информации, изучал, как человеческая речь передает смысл. В 1951 году он заявил, что английский язык на 80% избыточен — каждые 4 буквы из 5 можно вырезать, не потеряв смысла.
Расчеты Шеннона были немного суровыми: более поздние попытки анализа скорректировали цифру с 80% до 50%. Однако его основная теория выдержала испытание временем: каждый язык передает смысл с разной плотностью, и простой анализ скорости речи упускает из виду этот фундаментальный фактор.
В 2019 году исследователи из Лионского университета попытались определить, как распределяется баланс между скоростью речи и плотностью информации на примере 170 человек, которые читали одни и те же тексты на 17 языках. Самый медленный читал со скоростью 4,3 слога в секунду, а самый быстрый достиг скорости 9,1, демонстрируя, что скорость сильно варьируется.
Но самым интересным оказался анализ информационной плотности каждого языка. Ученые использовали оригинальную теорию Шеннона для расчета условной энтропии слогов в языках — другими словами, насколько сложно предсказать следующий слог на основе предыдущего. Таким образом, вьетнамский язык оказался одним из самых медленных, но в то же время оказался одним из самых богатых по плотности информации. Носителям вьетнамского языка необходимо произнести меньше слогов для передачи информации, чем говорящим по-испански.
Объединив оба показателя, французские исследователи создали новый параметр — коэффициент информации, который определяет, сколько данных язык может передавать в секунду. Причём этот коэффициент настолько незначительно различался между языками, что учёным удалось прийти к «универсальному» значению — 39 бит в секунду. По их мнению, эта цифра может быть примерным потолком скорости обработки речи человеческим мозгом.
Однако эксперимент в Лионском университете не был идеальным. Нюансы повседневной речи он не воспроизводил, поскольку все участники эксперимента читали заранее заданные тексты. Исследователям еще предстоит определить, меняется ли соотношение информации в более натуралистических лингвистических условиях.