Мат.стат. и теория вероятностей / Лекции / Л5-матстат
.pdf1
ЛЕКЦИЯ 5 КОРРЕЛЯЦИОННЫЙ АНАЛИЗ
1. Общие понятия
Корреляционный анализ предполагает изучение зависимости между случайными величинами с одновременной количественной оценкой степени неслучайности их совместного изменения.
Изменение случайной величины Y , соответствующее изменению случайной величины X , разбивается на две составляющие – стохастическую, связанную с неслучайной зависимостью Y от X , и случайную (или статистическую), связанную со случайным изменением величин Y и X .
Стохастическая составляющая связи между Y и X характеризуется коэффициентом корреляции
|
|
|
|
|
|
|
|
|
|
|
|
|
M |
|
|
X M X |
|
Y M Y |
|
|
|
|
|
|
|
|
|
|
|
. |
|
(1) |
|||
|
|
|
x y |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
||
Коэффициент корреляции показывает, насколько связь между |
|||||||||||
случайными величинами близка к линейной. |
|
|
|
|
|
||||||
Коэффициент |
|
корреляции |
|
нормирован |
в |
диапазоне |
|||||
значений 1 1. |
|
|
|
|
|
|
|
|
|
|
|
При 1 - имеет место строгая отрицательная корреляционная
зависимость.
При 1 строгая положительная линейная зависимость.
Уравнение линейной регрессии –тренд линейной корреляции имеет
вид |
|
|
|
|
|
|
|
|
|
|
|
y my |
|
y |
x mx . |
(2) |
|||
|
|
|
|||||||
|
|
|
|
|
x |
|
|||
2. Оценка коэффициента корреляции неранговыми методами |
|
||||||||
Пусть дана совокупность нормально распределенных величин X и Y |
|||||||||
по парам |
xi , yi - (распределение двумерное нормальное) объема n . |
|
|||||||
Выборочной оценкой коэффициента корреляции является величина |
|||||||||
|
|
|
n |
|
|
|
|
|
|
|
|
|
xi x yi y |
|
|||||
|
* |
|
i 1 |
|
|
|
|
. |
(3) |
|
|
|
|
|
|
|
|||
|
|
|
|
||||||
|
|
|
n |
|
n |
|
|||
|
|
|
xi |
x 2 yi y 2 |
|
||||
|
|
|
i 1 |
|
i 1 |
|
Лекция 5 МС Стаценко И.В.
2
Вычисление оценки коэффициента корреляции удобно проводить по другой формуле
|
|
|
|
1 n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
* |
|
|
xi x yi y |
|
|
|
|
|
|
|
|
xi x yi y |
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||
n i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
n i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
n |
|
|
|
2 |
n |
|
|
|
|
2 |
|
|
|
1 |
|
n |
|
|
|
|
2 |
1 n |
|
|
|
|
|
|
2 |
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
xi |
x |
|
yi y |
|
|
|
|
|
|
|
|
|
xi |
x |
|
|
|
|
|
yi |
y |
|
|
|
|
|
|
|
||||||||||||||||||||||||||
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||
|
|
|
i 1 |
|
|
|
|
i 1 |
|
|
|
|
|
|
|
|
|
|
|
n i 1 |
|
|
|
|
|
|
n i 1 |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
1 n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
xi yi |
xi y yi x x y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
n |
|
|
|
|
xy x y |
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||
|
|
* |
i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
(4) |
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
x 2 |
|
1 yi |
|
|
|
|
|
|
|
x2 x 2 y2 y 2 |
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
1 xi |
|
y 2 |
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
n i 1 |
|
|
|
n i 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
Далее с учетом замены генеральных параметров в уравнении |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||
регрессии (2) их статистическими точечными оценками |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
D * |
|
|
|
|
|
|
|
|
|
|
|
D * |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
D |
* |
|
|
|
|
|
|
|
|
|
|
|
||||||
y y * |
|
|
|
y |
|
x x |
|
* |
|
|
|
y |
x y |
* |
|
|
|
|
y |
|
x |
Ax B , |
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||
|
D * |
|
D * |
|
|
D |
* |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
и полученного выражения для вычисления оценки коэффициента корреляции линию регрессии по статистическим данным можно строить, используя формулу
|
|
|
|
|
y Ax B ; |
(5) |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
||
где |
A |
xy |
x y |
; |
B y Ax . |
|
|||||||
|
|
|
|
|
|
||||||||
|
|
|
|||||||||||
|
|
|
|
|
|
x2 x 2 |
|
|
|||||
При n 5 распределение случайной величины |
|
||||||||||||
|
|
1 |
|
|
|
1 * |
arcth * |
|
|||||
|
Z |
|
ln |
|
|
|
|
(6) |
|||||
|
|
|
|
|
|||||||||
|
|
2 |
|
|
|
1 * |
|
|
удовлетворительно аппроксимируется нормальным распределением с параметрами
Лекция 5 МС Стаценко И.В.
3
M Z arcth , |
|
D Z |
1 |
|
|
||||||||
|
|
|
. |
(7) |
|||||||||
n 3 |
|||||||||||||
При n 10 распределение случайной величины |
|
||||||||||||
|
|
* |
|
|
|
|
|
|
|
|
|||
T |
|
|
n 2 |
|
|
|
|
(8) |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
||||||||||
|
|
|
|||||||||||
|
1 |
*2 |
|
|
1 2 |
|
|
|
|
|
|||
удовлетворительно аппроксимируется |
|
распределением |
Стьюдента с |
k n 2 степенями свободы.
Гипотеза о значимости коэффициента корреляции – степени его
отклонения от нуля, формулируется следующим образом: |
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
H0 : |
|
0 против альтернативы H1 : |
|
0 . |
(9) |
||||||||||||||||
Корреляция между случайными величинами считается значимой, если |
|
||||||||||||||||||||
|
|
|
* |
|
|
H |
0 |
отклоняется. |
|
||||||||||||
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
С использованием статистик (7) и (8) получим |
|
||||||||||||||||||||
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
exp |
|
|
|
|
|
u1 /2 |
|
1 |
|
||||||||
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
n |
3 |
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
, |
|
|
(10) |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
N |
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
exp |
|
|
|
|
|
u1 /2 |
|
1 |
|
||||||||
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
n |
3 |
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
где |
u1 /2 -квантиль нормального распределения. |
|
|
||||||
|
|
|
|
|
t1 /2 n 2 |
, |
(11) |
||
|
|
|
|
|
|
||||
|
T |
|
|
n 2 |
t21 /2 n 2 |
|
|
||
|
|
|
|
|
|
|
|||
где |
t1 /2 n 2 -квантиль распределения Стьюдента с n 2 степенями |
||||||||
свободы. |
|
|
|
|
|
|
|
|
|
Пример 1. |
|
|
|
|
|
|
|
|
|
Дана совокупность |
нормально |
распределенных пар X ,Y |
случайных |
величин
Лекция 5 МС Стаценко И.В.
4
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
x i |
5 |
4 |
7 |
7 |
3 |
11 |
14 |
15 |
15 |
4 |
y i |
7 |
6 |
4 |
11 |
2 |
21 |
31 |
23 |
40 |
15 |
Проверить гипотезу о значимости корреляционной связи между X и
Y на уровне значимости 0,05 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
Решение: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
x 8,5 , |
|
y 16 ; |
|
|
|
|
|
xy 184; |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
x2 93,1; |
y2 |
398, 2 ; |
|
|
|||||||||||||||||||
|
|
D * 20,85; |
D |
* |
142, 2 ; |
|
|
||||||||||||||||||||
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
y |
|
|
|
|
|
|
|
|
|
||||
|
|
* |
|
184 8,5 16 |
|
|
|
0,88 ; |
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
20,85 142, 2 |
|
|
||||||||||||||||
По статистике (7) получим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
2 1,96 |
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
exp |
|
|
|
|
|
|
|
|
|
1 |
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
7 |
|
|
|
|
||||||||||||||||||
|
0,05 N |
|
|
|
|
|
|
|
|
|
|
|
|
0,6296 . |
|||||||||||||
|
|
|
|
|
2 1,96 |
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
exp |
|
|
|
|
|
|
|
|
|
1 |
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
7 |
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
По статистике (8) получим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
t0,95 8 |
|
|
|
1/2 |
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
2,312 |
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
0,05T |
|
8 t2 |
0,95 8 |
|
|
|
8 2,312 |
|
0,632. |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Так как 0,05 |
* 0,88 |
гипотеза |
|
о значимости коэффициента |
|||||||||||||||||||||||
корреляции принимается. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В соответствии с (5) линия тренда для примера 1 имеет вид:
Лекция 5 МС Стаценко И.В.
5
40
30
Y 20 f ( t)
10
0 |
5 |
10 |
15 |
20 |
10
X t
Пример 2.
В таблице представлен средний вес транзистора, производимого новым станком во время обкатки (приработки) станка в течение первых 12 месяцев эксплуатации. Определить является ли статистически значимым изменение веса транзистора в период обкатки станка. Использовать уровень значимости 0,05. (Полагать, что распределение данных величин
X ,Y близкое к нормальному)
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
x i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
y i |
12 |
12,03 |
12,06 |
12,07 |
12,1 |
12,08 |
12,07 |
12,05 |
12,03 |
12,02 |
12,02 |
12,01 |
Решение:
|
|
|
|
|
|
|
|
|
|
x 6,5, |
y 12,045 ; |
|
xy 78, 27 ; |
||||||
|
|
|
|
|
|
|
|||
|
x2 |
54,17 ; |
|
y2 145,08 ; |
|||||
D * 11,92 ; |
D * |
0,0009; |
|||||||
|
x |
|
|
y |
|
|
|
78, 27 54,17 145,08 * 0, 25;
11,92 0,0009
Лекция 5 МС Стаценко И.В.
6
|
|
|
|
|
|
exp |
2 1,96 |
1 |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
9 |
|
|
||||||||||||||
|
|
0,05 N |
|
|
|
|
|
|
|
|
|
|
0,57 . |
|||||||||
|
|
exp |
2 |
1,96 |
1 |
|||||||||||||||||
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
9 |
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
t |
0,95 |
|
|
|
|
|
|
|
1/2 |
|
||||||
|
|
0,05T |
|
|
|
|
|
|
10 |
|
|
|
|
|
|
|
0,58. |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
0,95 |
|
|
|
|
|||||||||||||
|
|
|
|
|
8 t2 |
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
10 |
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
0, 25 0,57 0,05N |
|
|
|
|
|||||||||||||||||
Так как |
* |
|
|
|
изменение веса транзистора в |
период обкатки станка является статистически не значимым.
3. Оценка коэффициента корреляции ранговыми методами
|
3.1. Коэффициент корреляции Кендалла |
|
|
|
|
||||||||||
Пусть |
дана |
совокупность случайных величин X |
и |
Y |
по |
парам |
|||||||||
xi , yi - (распределение любое) объема n . |
|
|
|
|
|
|
|||||||||
Расположим ряд значений |
xi |
|
в порядке возрастания, |
тогда ряд |
xi |
||||||||||
можно заменить последовательностью |
рангов |
данных |
величин |
- |
Rxi |
- |
|||||||||
1,2,3,..., n . Соответствующие по паре |
значений xi , yi |
ранги случайных |
|||||||||||||
величин Y обозначим - Ryi . |
|
|
|
|
|
|
|
|
|
|
|
|
|||
Назовем пару рангов Ryk , Ryl |
инверсией, если в последовательности |
||||||||||||||
рангов Ryi , 1, 2,3,..., n наблюдаем |
Ryk Ryl . |
Обозначим число таких пар |
|||||||||||||
величиной Q . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициент корреляции Кендалла (при отсутствии совпадений |
|||||||||||||||
рангов) вычисляется по формуле |
|
|
|
|
|
|
|
|
|
|
|||||
|
|
1 |
|
|
4Q |
|
|
, |
1 1. |
|
|
|
(12) |
||
|
|
|
|
|
|
|
|
|
|||||||
|
|
n |
|
n 1 |
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
При |
n 10 |
гипотеза о |
значимости |
коэффициента |
корреляции |
||||||||||
принимается на уровне значимости |
|
, если величина |
|
|
|
|
|
Лекция 5 МС Стаценко И.В.
7
|
|
|
|
|
|
|
|
||
|
|
u |
2 2n 5 |
, |
(13) |
||||
|
|
|
|
||||||
|
|
1 |
9n |
|
|
|
|||
|
|
n 1 |
|
|
|
будет меньше величины ;
где u1 - квантиль нормального распределения,
То есть, если - коэффициент корреляции считают статистически значимым.
Пример 3. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
Дана совокупность случайных величин X и Y , реализации которых |
|||||||||||||||
представлены парами значений |
xi , yi . |
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
2 |
3 |
|
4 |
|
5 |
6 |
|
7 |
|
8 |
9 |
10 |
|
x i |
5 |
|
4 |
7 |
|
8 |
|
3 |
11 |
|
14 |
|
15 |
16 |
6 |
|
y i |
7 |
|
6 |
4 |
|
11 |
|
2 |
21 |
|
31 |
|
23 |
40 |
15 |
|
|
Найти |
коэффициент |
|
корреляций |
данных |
величин, |
используя |
ранговый метод Кендалла, и проверить статистическую значимость коэффициента на уровне значимости 0,05 .
Решение: |
|
|
|
|
|
|
|
|
|
|
|
|
||
1. |
Расположим значения случайной величины |
X в порядке возрастания |
||||||||||||
вместе с соответствующими им в паре значениями случайной величины Y . |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
8 |
9 |
|
10 |
|
x i |
|
3 |
4 |
5 |
6 |
7 |
8 |
11 |
|
14 |
15 |
|
16 |
|
y i |
|
2 |
6 |
7 |
15 |
4 |
11 |
21 |
|
31 |
23 |
|
40 |
|
2. |
Запишем ранги для значений случайной величины |
X , |
а под ними |
соответствующие ранги значений случайной величины Y .
Лекция 5 МС Стаценко И.В.
8
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
x i |
3 |
4 |
4 |
5 |
7 |
7 |
11 |
14 |
15 |
15 |
y i |
2 |
6 |
7 |
15 |
4 |
11 |
21 |
31 |
23 |
40 |
R x i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
R y i |
1 |
3 |
4 |
6 |
2 |
5 |
7 |
9 |
8 |
10 |
3.Расчет числа инверсий рангов для случайной величины Y :
Q1 0, |
так как |
1 3, |
1 6 , …., |
1 10 ; |
||
Q2 1, |
так как |
3 2 ; |
|
|
||
Q3 1, |
так как |
4 2; |
|
|
||
Q4 2, |
так как |
6 2 , |
6 5; |
|
||
Q5 0 |
; |
|
|
|
|
|
Q6 |
0 |
; |
|
|
|
|
Q7 |
0 ; |
|
|
|
|
|
Q8 |
1; |
так как |
6 8 . |
|
|
|
Q9 |
0 |
; |
|
|
|
|
Q10 0 .
Число инверсий рангов Q 5.
4. Расчет коэффициента корреляции Кендалла
1 |
|
|
4Q |
1 |
4 5 |
|
7 |
0,78. |
|
|
|
|
|
||||
|
n |
10 9 9 |
||||||
|
|
n 1 |
5. Расчет граничного значения критической области
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
u |
2 2n 5 |
|
1,64 |
2 2 10 5 |
|
0, 41. |
||||||
|
|
|
|
|
|
|||||||||
|
|
|
1 |
9n |
|
|
|
|
|
|||||
|
|
|
n 1 |
|
|
|
9 10 10 1 |
|
|
|||||
Далее, |
учитывая, |
что |
|
, |
полагаем |
коэффициент корреляции |
статистически значимым.
Недостаток метода: усложнение расчетной схемы при наличии совпадающих рангов в последовательностях рангов.
Лекция 5 МС Стаценко И.В.
9
3.2. Коэффициент корреляции Спирмена |
|
|
Пусть дана совокупность |
случайных величин X и Y по |
парам |
xi , yi - (распределение любое) объема n . |
|
|
Находим разность рангов |
di Rxi Ryi , соответствующую |
паре |
xi , yi . |
|
|
Коэффициент корреляции Спирмена определяется формулой
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 di2 |
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
1 |
|
|
i 1 |
|
|
, |
|
|
1 1. |
|
|
(14) |
|||||||
|
|
|
|
|
|
|
|
|
n |
|
n2 1 |
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
При n 10 |
|
корреляция |
|
считается |
статистически |
значимой, если |
||||||||||||||||||||
величина |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
u |
1 /2 |
|
|
, |
|
|
|
|
|
(15) |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n 1 |
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
будет меньше, чем |
|
|
|
; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
где |
u1 /2 - квантиль нормального распределения. |
|
|
|
|
|||||||||||||||||||||||
Пример 4. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
Дана совокупность случайных величин X и Y , реализации которых |
||||||||||||||||||||||||||
представлены парами значений xi , yi |
. |
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
1 |
|
2 |
|
3 |
|
4 |
|
5 |
|
|
|
6 |
|
7 |
|
8 |
9 |
10 |
|
|||||||
x i |
|
5 |
|
4 |
|
7 |
|
7 |
|
3 |
|
|
|
11 |
|
14 |
|
15 |
15 |
4 |
|
|||||||
y i |
|
7 |
|
6 |
|
4 |
|
11 |
|
2 |
|
|
|
21 |
|
31 |
|
23 |
40 |
15 |
|
|||||||
|
|
Найти |
коэффициент |
|
корреляции |
данных |
величин, |
используя |
ранговый метод Спирмена и проверить статистическую значимость коэффициента на уровне значимости 0,05 .
Решение:
1. Запишем ранги случайных величин X и Y по парам и разности рангов
Лекция 5 МС Стаценко И.В.
10
|
|
1 |
2 |
3 |
|
4 |
|
|
|
|
5 |
|
|
6 |
|
7 |
8 |
|
9 |
|
10 |
|
||||
x i |
|
5 |
4 |
7 |
|
7 |
|
|
|
|
3 |
|
|
11 |
|
14 |
15 |
|
15 |
|
4 |
|
||||
y i |
|
7 |
6 |
4 |
|
11 |
|
|
|
|
2 |
|
|
21 |
|
31 |
23 |
|
40 |
|
15 |
|
||||
R x i |
|
4 |
2,5 |
5,5 |
|
5,5 |
|
|
|
|
1 |
|
|
7 |
|
8 |
9,5 |
|
9,5 |
|
2,5 |
|
||||
R y i |
|
4 |
3 |
2 |
|
5 |
|
|
|
|
1 |
|
|
7 |
|
9 |
8 |
|
10 |
|
6 |
|
||||
d i |
|
0 |
-0,5 |
3,5 |
|
0,5 |
|
|
|
|
0 |
|
|
0 |
|
-1 |
1,5 |
|
-0,5 |
|
-3,5 |
|
||||
2. Расчет коэффициента корреляции Спирмена |
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
6 di2 |
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
1 |
|
|
i 1 |
|
|
|
0,83 . |
|
|
|
|
|
|
|||||||||
|
|
|
|
n |
|
n2 |
1 |
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
3. Расчет граничного значения критической области |
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
u |
1 /2 |
|
|
|
1,96 |
0,65 . |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
n 1 |
|
|
3 |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
Далее, |
учитывая, что , |
полагаем коэффициент |
корреляции |
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
статистически значимым. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Пример 5. (решение примера 2 вторым способом) |
|
|
|
|
|
|
||||||||||||||||||||
|
В |
таблице представлен средний вес |
транзистора, |
производимого |
новым станком во время обкатки (приработки) станка в течение первых 12 месяцев эксплуатации. Определить является ли статистически значимым
изменение веса транзистора в период обкатки станка. Использовать уровень значимости 0,05.
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
x i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
y i |
12 |
12,03 |
12,06 |
12,07 |
12,1 |
12,08 |
12,07 |
12,05 |
12,03 |
12,02 |
12,02 |
12,01 |
Решение:
1.Представим ранжировку последовательностей X и Y по парам и разности рангов
Лекция 5 МС Стаценко И.В.