КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
,
совокупность основанных на матем. теории корреляции методов обнаружения
корреляционной зависимости между двумя случайными признаками или факторами.
К.а. экспериментальных данных заключает в себе следующие осн. практич.
приёмы: 1) построение корреляционного поля и составление корреляционной
таблицы; 2) вычисление выборочных коэфф. корреляции или корреляционного
отношения; 3) проверка статистич. гипотезы значимости связи. Дальнейшее
исследование заключается в установлении конкретного вида зависимости между
величинами (см. Регрессионный анализ). Зависимость между тремя и
большим числом случайных признаков или факторов изучается методами многомерного
К. а. (вычисление частных и множественных коэфф. корреляции и корреляционных
отношений).
Корреляционное поле и корреляционная
Предполагая длины интервалов
Коэффициент корреляции и
Выборочное значение ny|x
Проверка гипотезы значимости
В случае когда изучаются
где di - разность
Лит. см. при ст. Корреляция.
А. В. Прохоров.
А
Б
В
Г
Д
Е
Ё
Ж
З
И
Й
К
Л
М
Н
О
П
Р
С
Т
У
Ф
Х
Ц
Ч
Ш
Щ
Ъ
Ы
Ь
Э
Ю
Я
таблица являются вспомогат. средствами при анализе выборочных данных. При
нанесении на координатную плоскость выборочных точек получают корреляционное
поле. По характеру расположения точек поля можно составить предварительное
мнение о форме зависимости случайных величин (напр., о том, что одна величина
в среднем возрастает или убывает при возрастании другой). Для численной
обработки результаты обычно группируют и представляют в форме корреляционной
табл. В каждой клетке корреляционной табл. (см. в ст. Корреляция в
математич. статистике) приводятся численности n
пар (х, у), компоненты к-рых попадают в соответствующие интервалы
группировки по каждой переменной.
группировки (по каждому из переменных) равными между собой, выбирают центры
x
и числа n
корреляционное отношение дают более точную информацию о характере и силе
связи, чем картина корреляционного поля. Выборочный коэфф. корреляции определяют
по формуле:
При большом числе независимых
наблюдений, подчиняющихся одному и тому же распределению, и при надлежащем
выборе интервалов группировки коэфф. р близок к истинному коэфф. корреляции
р. Поэтому использование р как меры связи имеет чётко определённый смысл
для тех распределений, для к-рых естеств. мерой зависимости служит р (т.
е. для нормальных или близких к ним распределений). Во всех др. случаях
в качестве характеристики силы связи рекомендуется использовать корреляц.
отношение л, интерпретация к-рого не зависит от вида исследуемой зависимости.
вычисляется по данным корреляц. табл.:
Так, при анализе корреляции
между высотой и диаметром северной сосны было обнаружено, что условные
ср. значения высоты сосны для заданного диаметра связаны нелинейной зависимостью.
Корреляц. отношение (высоты к диаметру) в этом случае равно 0,813, а коэфф.
корреляции равен 0,762.
связи основывается на знании законов распределения выборочных корреляц.
характеристик. В случае нормального распределения величина выборочного
коэфф. корреляции р считается значимо отличной от нуля, если выполняется
неоавенство
где t
есть критич. значение t-распределения Стьюдента с (п - 2) степенями
свободы, соответствующее выбранному уровню значимости а (см. Стьюдента
распределение). Если же известно, что р не равно 0, то необходимо
воспользоваться z-преобразованием Фишера (не зависящим от р и п):
Исходя из приближённой нормальности
z, можно определить доверительные интервалы для истинного коэфф. корреляции
р.
не количеств, признаки, а качественные, обычные меры зависимости не годятся.
Однако, если удаётся к.-л. образом упорядочить изучаемые объекты в отношении
нек-рого признака, т. е. прописать им порядковые номера - ранги (по два
номера в соответствии с двумя признаками), то в качестве выборочной характеристики
связи можно воспользоваться, напр., т. н. коэфф. ранговой корреляции:
рангов по обоим признакам для каждого объекта. По степени уклонения R от
нуля можно сделать нек-рое заключение о степени зависимости качественных
признаков. Проверка гипотезы независимости признаков при небольшом объёме
выборки производится с помощью специальных таблиц, а при п > 10
для вычисления критич. значений выборочных коэфф. пользуются тем, что эти
величины распределены приближённо нормально.