СТАТИСТИЧЕСКАЯ ЛИНГВИСТИКА
дисциплина,
изучающая количеств, закономерности естественного языка, проявляющиеся
в текстах. В основе С. л. лежит предположение, что нек-рые численные характеристики
и функциональные зависимости между ними, полученные для ограниченной совокупности
текстов, характеризуют язык в целом или его функциональные стили (публицистический,
научный, художественный и т. п.). Практически важной и наиболее изученной
числовой характеристикой является относит, частота употребления различных
лингвистических единиц (букв, фонем, слогов, слов, синтаксич. конструкций),
их классов (напр., гласных, согласных, частей речи) и сочетаний (напр.,
последовательностей из
букв). Данные о частоте слов (иногда словосочетаний) отражаются в частотных
словарях. Важную роль в С. л. играет функциональная зависимость, приближённо
описывающая связь между частотой слова и его номером (рангом) в последовательности
по убыванию частот - Ципфа - Мандельброта закон. С. л. изучает также зависимости
между частотой и длиной слова (в числе слогов), числом его значений и возрастом.
Накопленные данные используются для выявления особенностей стиля отдельных
авторов, атрибуции текстов, дешифровки исторических письменностей, для
решения задач стенографии, теории связи, а также информатики. С. л.
при получении численных характеристик использует методы математической
статистики и нек-рые методы теории информации (для определения энтропии
и избыточности языка, см. Информации теория), а для установления
связи между наблюдаемыми характеристиками и выбора наиболее существенных
из них - метод математич. моделей, базирующихся на понятиях теории вероятностей
(см. Вероятностей теория) и математической лингвистики. Возможно
более широкое понимание С. л. как использования методов статистики для
проверки лингвистич. гипотез, к-рые могут носить и качественный характер.
Лит.: Головин Б. H., Язык и статистика,
M., 1971; Фрумкина P. M., Статистические методы и стратегия лингвистического
исследования, "Изв. АН СССР. Серия литературы и языка", 1975, т. 34, №2;
Штейнфельдт Э.А., Частотный словарь современного русского языка, Таллин,
1963; Her da n G., The advanced theory of language as choice and chance,
B., 1966; M u 1 1 e r Ch., Initiation a Ia statistique linguistique, P.,
1968. M. В. Арапов.
А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я