КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ,
совокупность основанных на матем. теории корреляции методов обнаружения
корреляционной зависимости между двумя случайными признаками или факторами.
К.а. экспериментальных данных заключает в себе следующие осн. практич.
приёмы: 1) построение корреляционного поля и составление корреляционной
таблицы; 2) вычисление выборочных коэфф. корреляции или корреляционного
отношения; 3) проверка статистич. гипотезы значимости связи. Дальнейшее
исследование заключается в установлении конкретного вида зависимости между
величинами (см. Регрессионный анализ). Зависимость между тремя и
большим числом случайных признаков или факторов изучается методами многомерного
К. а. (вычисление частных и множественных коэфф. корреляции и корреляционных
отношений).


Корреляционное поле и корреляционная
таблица являются вспомогат. средствами при анализе выборочных данных. При
нанесении на координатную плоскость выборочных точек получают корреляционное
поле. По характеру расположения точек поля можно составить предварительное
мнение о форме зависимости случайных величин (напр., о том, что одна величина
в среднем возрастает или убывает при возрастании другой). Для численной
обработки результаты обычно группируют и представляют в форме корреляционной
табл. В каждой клетке корреляционной табл. (см. в ст. Корреляция в
математич. статистике) приводятся численности nтех
пар (х, у), компоненты к-рых попадают в соответствующие интервалы
группировки по каждой переменной.


Предполагая длины интервалов
группировки (по каждому из переменных) равными между собой, выбирают центры
x(соответственно yэтих интервалов
и числа n
в качестве основы для расчётов.


Коэффициент корреляции и
корреляционное отношение дают более точную информацию о характере и силе
связи, чем картина корреляционного поля. Выборочный коэфф. корреляции определяют
по формуле:



При большом числе независимых
наблюдений, подчиняющихся одному и тому же распределению, и при надлежащем
выборе интервалов группировки коэфф. р близок к истинному коэфф. корреляции
р. Поэтому использование р как меры связи имеет чётко определённый смысл
для тех распределений, для к-рых естеств. мерой зависимости служит р (т.
е. для нормальных или близких к ним распределений). Во всех др. случаях
в качестве характеристики силы связи рекомендуется использовать корреляц.
отношение л, интерпретация к-рого не зависит от вида исследуемой зависимости.


Выборочное значение ny|x
вычисляется по данным корреляц. табл.:



Так, при анализе корреляции
между высотой и диаметром северной сосны было обнаружено, что условные
ср. значения высоты сосны для заданного диаметра связаны нелинейной зависимостью.
Корреляц. отношение (высоты к диаметру) в этом случае равно 0,813, а коэфф.
корреляции равен 0,762.


Проверка гипотезы значимости
связи основывается на знании законов распределения выборочных корреляц.
характеристик. В случае нормального распределения величина выборочного
коэфф. корреляции р считается значимо отличной от нуля, если выполняется
неоавенство



где t
есть критич. значение t-распределения Стьюдента с (п - 2) степенями
свободы, соответствующее выбранному уровню значимости а (см. Стьюдента
распределение).
Если же известно, что р не равно 0, то необходимо
воспользоваться z-преобразованием Фишера (не зависящим от р и п):



Исходя из приближённой нормальности
z, можно определить доверительные интервалы для истинного коэфф. корреляции
р.


В случае когда изучаются
не количеств, признаки, а качественные, обычные меры зависимости не годятся.
Однако, если удаётся к.-л. образом упорядочить изучаемые объекты в отношении
нек-рого признака, т. е. прописать им порядковые номера - ранги (по два
номера в соответствии с двумя признаками), то в качестве выборочной характеристики
связи можно воспользоваться, напр., т. н. коэфф. ранговой корреляции:




где di - разность
рангов по обоим признакам для каждого объекта. По степени уклонения R от
нуля можно сделать нек-рое заключение о степени зависимости качественных
признаков. Проверка гипотезы независимости признаков при небольшом объёме
выборки производится с помощью специальных таблиц, а при п > 10
для вычисления критич. значений выборочных коэфф. пользуются тем, что эти
величины распределены приближённо нормально.


Лит. см. при ст. Корреляция.

А. В. Прохоров.





А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я