РЕГРЕССИЯ
в теории вероятностей
Изучение Р. в теории вероятностей основано
Е(У | х) = и(х).
Уравнение у = и (х), в к-ром
D(У | х) = o2(x).
Если o2 (х) = 0 при всех
Линии Р. обладают следующим замечательным
Наиболее простым является тот случай, когда
Е(У| х) = B Коэффициенты B где m а р - коэффициент корреляции между X и
В случае, когда совместное распределение
Если Р. У по X отлична от линейной, то
Наиболее важное значение имеет параболическая
Понятие Р. применимо не только к случайным
у = и (x то Р. наз. линейной. Эта форма уравнения
Простым примером Р. У по X является зависимость
На практике обычно коэффициенты Р. в уравнении
Первоначально термин "Р." был употреблён
Лит.: Крамер Г., Математические
А
Б
В
Г
Д
Е
Ё
Ж
З
И
Й
К
Л
М
Н
О
П
Р
С
Т
У
Ф
Х
Ц
Ч
Ш
Щ
Ъ
Ы
Ь
Э
Ю
Я
и математической статистике, зависимость среднего значения к.-л. величины
от нек-рой другой величины или от нескольких величин. В отличие от чисто
функциональной зависимости у = f (х), когда каждому значению независимой
переменной х соответствует одно определённое значение величины у,
при
регрессионной связи одному и тому же значению х могут соответствовать
в зависимости от случая различные значения величины у. Если при
каждом значении х = x
то зависимость
средних арифметических y
уin
Примером такого рода зависимости служит, в частности, зависимость средних
диаметров сосен от их высот; см. табл. в ст. Корреляция.
на том, что случайные величины X и У, имеющие совместное распределение
вероятностей, связаны вероятностной зависимостью: при каждом фиксированном
значении X = х величина У является случайной величиной с определённым
(зависящим от значения х) условным распределением вероятностей.
Р. величины У по величине X определяется условным математич. ожиданием
У, вычисленным при условии, что X = х:
х
играет
роль "независимой" переменной, наз. уравнением регрессии, а соответствующий
график - линией регрессии величины У по X. Точность, с к-рой уравнение
Р. У по X отражает изменение У в среднем при изменении
х,
измеряется
условной дисперсией величины У, вычисленной для каждого значения X = х:
значениях х, то можно с достоверностью утверждать, что У и X связаны
строгой функциональной зависимостью У = и (X). Если o2(х)
не равно 0 при всех значениях х и и (х) не зависит от
х,
то
говорят, что Р. У по X отсутствует. Аналогичным образом определяется Р.
X по У и, в частности, уравнение Р. х = v (у), где v (у)
= = Е (Х|У = у). Функции у = и (х) и х = v (у), вообще
говоря, не являются взаимно обратными.
свойством: среди всех действительных функций f (х) минимум математич.
ожидания Е [У - f(X)]2 достигается для функции f(x)
= и(х), т. е. Р. У по X даёт наилучшее, в указанном смысле, представление
величины У по величине X. Это свойство используется для прогноза У по X:
если значение У непосредственно не наблюдается и эксперимент позволяет
регистрировать лишь компоненту X вектора (X, У), то в качестве прогнозируемого
значения У используют величину и (X).
Р. У по X линейна:
ожидания X и Y, о
- дисперсии X и У,
Y. Уравнение Р. при этом выражается формулой
X и У нормально, обе линии Р. у = и(х) и х = v (у) являются
прямыми.
последнее уравнение есть линейная аппроксимация истинного уравнения Р.:
математич. ожидание Е [У - b
достигает
минимума по b
B
функций:
(полиномиальная) Р., при к-рой
ф
x, ..., ф
величинам, но и к случайным векторам. В частности, если У - случайная величина,
а X = (X
имеющие совместное распределение вероятностей, то P. Y по X определяется
уравнением
Р. включает в себя мн. типы Р. с одной независимой переменной, в частности
полиномиальная Р. У по X порядка k сводится к линейной Р.
У по X
между У и X, к-рая выражается соотношением: У = и (X) + o, где
и
(х) = Е (У|Х = х), а случайные величины X и 6 независимы. Это
представление полезно, когда планируется эксперимент для изучения функциональной
связи у = и (х) между неслучайными величинами у и х.
у
=
и
(х)
неизвестны и их оценивают по экспериментальным данным (см.
Регрессионный
анализ).
англ. статистиком Ф. Гальтоном (1886) в теории наследственности в следующем
специальном смысле: "возвратом к среднему состоянию" (regression to mediocrity)
было названо явление, состоящее в том, что дети тех родителей, рост к-рых
превышает среднее значение на а единиц, имеют в среднем рост, превышающий
среднее значение меньше чем на а единиц.
методы статистики, пер. с англ., М., 1948; Кендалл М. Дж. , Стьюарт А.,
Статистические выводы и связи, пер. с англ., М., 1973. А. В. Прохоров.