ФЕДЕРАЛЬНОЕ АГЕНСТВО ЖЕЛЕЗНОДОРОЖНОГО ТРАНСПОРТА
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСТЕТ ПУТЕЙ СООБЩЕНИЯ (МИИТ)
Институт транспортной техники и организации производства
(ИТТОП)
Кафедра: «Локомотивы и локомотивное хозяйство»
Курсовой проект
на тему:
«Статистические методы обработки выборочных данных наблюдений или экспериментов»
Выполнил: студент Краснов М.А.
группы ТЛТ-451
Принял: Пузанков А.Д.
Москва 2009
СОДЕРЖАНИЕ
1. ПЕРВИЧНЫЙ АНАЛИЗ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
2. ПОСТРОЕНИЕ ЭМПИРИЧЕСКОЙ ПЛОТНОСТИ РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ АНАЛИЗИРУЕМОЙ ВЕЛИЧИНЫ И РАСЧЕТ ЕЕ ХАРАКТЕРИСТИК
3. ОПРЕДЕЛЕНИЕ ВИДА ЗАКОНА РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ И РАСЧЕТ ЕГО ПАРАМЕТРОВ ПРИ ПОМОЩИ МЕТОДА МОМЕНТОВ
4. ОПРЕДЕЛЕНИЕ ВИДА ТЕОРЕТИЧЕСКОГО ЗАКОНА РАСПРЕДЕЛЕНИЯ СЛУЧАЙНОЙ ВЕЛИЧИНЫ ГРАФИЧЕСКИМ МЕТОДОМ
1.
Первичный анализ экспериментальных данных
Запишем полученные значения в вариационный ряд в возрастающем порядке:
Таблица 1.
16,4
|
21,6
|
35,46
|
38,76
|
39,84
|
40,65
|
44,25
|
46,73
|
47,62
|
50,25
|
50,25
|
51,02
|
51,8
|
55,22
|
55,25
|
55,55
|
61,73
|
63,3
|
64,93
|
67,56
|
68,5
|
68,5
|
71,94
|
73
|
73,53
|
73,53
|
74,07
|
77,52
|
78,12
|
78,74
|
78,74
|
80,64
|
85,47
|
86,2
|
87,72
|
90,1
|
92,6
|
94,34
|
95,24
|
96,15
|
99,01
|
99,01
|
106,4
|
108,6
|
116,28
|
133,3
|
135,13
|
137
|
144,93
|
149,25
|
153,84
|
161,3
|
166,7
|
172,4
|
172,4
|
175,44
|
178,6
|
178,6
|
185,18
|
192,3
|
208,33
|
212,76
|
227,27
|
232,56
|
238,1
|
243,9
|
256,41
|
277,8
|
277,8
|
285,7
|
285,71
|
285,71
|
322,6
|
322,6
|
344,83
|
370,4
|
370,4
|
370,4
|
384,6
|
420,6
|
526,3
|
555,55
|
588,23
|
943,4
|
xmax
= 943,4; xmin
= 16,4
Результат последних двух измерений вызывает сомнения. Поэтому выполняем проверку:
Величину выборочного среднего
находим из соотношения:
(1)
Корень квадратный из дисперсии, взятый с положительным знаком, называется среднеквадратическим отклонением и рассчитывается по формуле:
(2)
Упрощённая проверка сомнительного результата на брак выполняется из условия:
Таким образом, по упрощенной проверке результат сомнительного измерения браком являются последнее одно значение, отбрасываем их и пересчитываем
и
:
Проверяем по упрощённой проверки:
Таким образом, по упрощенной проверке результат сомнительного измерения браком являются последние два значения, отбрасываем их и пересчитываем
и
:
Таким образом, по упрощенной проверке результат сомнительного измерения браком являются последнее одно значение, отбрасываем их и пересчитываем
и
:
Таким образом, по упрощенной проверке результат сомнительного измерения не является браком.
Так же выполним подобную проверку с помощью критерия Ирвина:
Таким образом, по расчётам обеих проверок результат последнего сомнительного измерения не является браком.
Из этого следует, что нужно произвести повторный расчёт, но уже без данного измерения:
2. Построение эмпирической плотности распределения случайной анализируемой величины и расчёт её характеристик
Определяем размах имеющихся данных, т.е. разности между наибольшим и наименьшим выборочным значениями (R = Xmax – Xmin):
Выбор числа интервалов группировки k при числе наблюдений n<100 – ориентировочное значение интервалов можно рассчитать с использованием формулы Хайнхольда и Гаеде:
Тогда ширина интервала:
Результат подсчёта частот и характеристик эмпирического распределения
Таблица 2.
Границы интервала
группировки
|
Ср.знач.
интерв.
|
Распределение
данных
|
fi
|
U
|
U*f
|
U^2*f
|
16,4…61,31
|
38,86
|
////////////////
|
16
|
-1
|
-16
|
16
|
61,31…106,22
|
83,77
|
//////////////////////////
|
26
|
0
|
0
|
0
|
106,22…151,13
|
128,68
|
////////
|
8
|
1
|
8
|
8
|
151,13…196,04
|
173,59
|
//////////
|
10
|
2
|
20
|
40
|
196,04…240,96
|
218,50
|
/////
|
5
|
3
|
15
|
45
|
240,96…285,87
|
263,41
|
/////
|
5
|
4
|
20
|
80
|
285,87…330,78
|
308,32
|
////
|
4
|
5
|
20
|
100
|
330,78…375,69
|
353,23
|
////
|
4
|
6
|
24
|
144
|
375,69…420,60
|
398,14
|
//
|
2
|
7
|
14
|
98
|
ИТОГО
|
80
|
105
|
531
|
Принимаем «ложный нуль» x0
=83,77 и обозначаем нулем тот интервал, которому соответствует максимальная частота (f=26). Далее, для интервалов, следующих к наименьшему наблюдаемому значению вписываем -1, -2 … и 1, 2, … для интервалов, следующих к наибольшему значению наблюдаемой величины.
Выборочное среднее х и среднеквадратическое отклонение Sx рассчитываем, используя следующие выражения:
(3)
Для построения гистограммы, приведённой на рис.1, по оси абсцисс в выбранном масштабе отмечаем границы интервалов. Левая ось размечается масштабом частот, а на правую, в случае необходимости, можно нанести шкалу относительных частот. На чистом поле гистограммы указываются значения: числа данных; среднего арифметического; среднеквадратического отклонения.
Рис.1
Помимо гистограммы эмпирические данные измерений случайной величины могут быть представлены в виде кумулятивной кривой функции распределения вероятностей. Для этого данные, представленные в табл.1., должны быть дополнены частостями (см. табл.2.).
Частость находим из соотношения:
Таблица частот f и частостей ω.
Таблица 3.
Границы интервала
группировки
|
Частота,fi
|
Частость,
ω i
|
Накопленная
частость, ω н
|
16,4…61,31
|
16
|
0,20
|
0,20
|
61,31…106,22
|
26
|
0,33
|
0,53
|
106,22…151,13
|
8
|
0,10
|
0,63
|
151,13…196,04
|
10
|
0,13
|
0,75
|
196,04…240,96
|
5
|
0,06
|
0,81
|
240,96…285,87
|
5
|
0,06
|
0,88
|
285,87…330,78
|
4
|
0,05
|
0,93
|
330,78…375,69
|
4
|
0,05
|
0,98
|
375,69…420,60
|
2
|
0,03
|
1,00
|
ИТОГО
|
80
|
1
|
Рис. 2
3. Определение вида закона распределения случайной величины и расчёт его параметров при помощи метода моментов
Экспоненциальный (нормальный) закон распределения
Параметр закона распределения:
Таблица 4
№
|
xi
103
км
|
fi
шт
|
λ*xi
|
e-λ*xi
|
φ(xi)
10-6
|
fi’
шт
|
|
1
|
38,86
|
16
|
0,270
|
0,763
|
0,531
|
19,08
|
0,50
|
2
|
83,77
|
26
|
0,583
|
0,558
|
0,388
|
13,96
|
10,39
|
3
|
128,68
|
8
|
0,895
|
0,408
|
0,284
|
10,21
|
0,48
|
4
|
173,59
|
10
|
1,208
|
0,299
|
0,208
|
7,47
|
0,86
|
5
|
218,50
|
5
|
1,520
|
0,219
|
0,152
|
5,47
|
0,04
|
6
|
263,41
|
5
|
1,833
|
0,160
|
0,111
|
4,00
|
0,25
|
7
|
308,32
|
4
|
2,145
|
0,117
|
0,081
|
2,93
|
0,39
|
8
|
353,23
|
4
|
2,458
|
0,086
|
0,060
|
2,14
|
1,62
|
9
|
398,14
|
2
|
2,770
|
0,063
|
0,044
|
1,57
|
0,12
|
ИТОГО:
|
80
|
14,64
|
Рис. 4
Нормальный закон распределения двухпараметрический, число степеней свободы υ = 7 и
= 14,067.
Так как χ2
> χ0,05
2
, то гипотеза о принадлежности эмпирической выборки значений, экспоненциальному закону распределения отвергается
Распределение Вейбулла - Гнеденко
Величина выборочного коэффициента вариации:
По данным приложения таблица П1,2:
Таблица 5
№
|
Xi
103
км
|
fi
шт
|
xi/a
|
a* φ(xi)
|
φ(xi)
10-6
|
fi’
шт
|
|
1
|
38,86
|
16
|
0,246
|
0,6944
|
4,4017
|
15,81
|
0,00
|
2
|
83,77
|
26
|
0,531
|
0,7197
|
4,5618
|
16,39
|
5,63
|
3
|
128,68
|
8
|
0,816
|
0,6085
|
3,8567
|
13,86
|
2,48
|
4
|
173,59
|
10
|
1,100
|
0,4637
|
2,9393
|
10,56
|
0,03
|
5
|
218,50
|
5
|
1,385
|
0,3293
|
2,0870
|
7,50
|
0,83
|
6
|
263,41
|
5
|
1,670
|
0,2213
|
1,4029
|
5,04
|
0,00
|
7
|
308,32
|
4
|
1,954
|
0,1422
|
0,9014
|
3,24
|
0,18
|
8
|
353,23
|
4
|
2,239
|
0,0879
|
0,5570
|
2,00
|
2,00
|
9
|
398,14
|
2
|
2,524
|
0,0525
|
0,3325
|
1,19
|
0,54
|
ИТОГО:
|
80
|
75,60
|
11,69
|
Рис. 5
Нормальный закон распределения двухпараметрический, число степеней свободы υ = 6 и
= 12,592.
Так как χ2
> χ0,05
2
, то эмпирическая выборка значений пренадлежит закону распределения Вейбулла - Гнеденко
Нормальный (Гауссовский) закон распределения
Таблица 6
№
|
Xi
103
км
|
fi
|
ti
|
φ(ti)
10-2
|
φ(xi)
|
fi’
щт
|
|
1
|
38,86
|
16
|
-1,025
|
0,231
|
0,101
|
8,09
|
7,72
|
2
|
83,77
|
26
|
-0,586
|
0,328
|
0,144
|
11,52
|
18,18
|
3
|
128,68
|
8
|
-0,147
|
0,386
|
0,169
|
13,53
|
2,26
|
4
|
173,59
|
10
|
0,292
|
0,374
|
0,164
|
13,11
|
0,74
|
5
|
218,50
|
5
|
0,731
|
0,298
|
0,131
|
10,48
|
2,86
|
6
|
263,41
|
5
|
1,169
|
0,197
|
0,086
|
6,91
|
0,53
|
7
|
308,32
|
4
|
1,608
|
0,107
|
0,047
|
3,75
|
0,02
|
8
|
353,23
|
4
|
2,047
|
0,048
|
0,021
|
1,68
|
3,18
|
9
|
398,14
|
2
|
2,486
|
0,018
|
0,008
|
0,62
|
3,04
|
ИТОГО:
|
80
|
69,71
|
38,54
|
Рис. 6
Нормальный закон распределения двухпараметрический, число степеней свободы υ = 6 и
= 12.592.
Так как χ2
> χ0,05
2
, то гипотеза о принадлежности эмпирической выборки значений, нормальному (Гауссовскому) закону распределения отвергается
Логарифмически - нормальный закон распределения
Значения средне-выборочное и средне-квадратичное:
Таблица 7
№
|
Xi
103
км
|
fi
|
ti
|
φ(ti)
|
φ(xi)
|
fi’
щт
|
|
1
|
38,86
|
16
|
-1,481
|
0,133
|
4,808
|
17,28
|
0,094
|
2
|
83,77
|
26
|
-0,404
|
0,367
|
6,155
|
22,12
|
0,682
|
3
|
128,68
|
8
|
0,198
|
0,391
|
4,263
|
15,32
|
3,494
|
4
|
173,59
|
10
|
0,618
|
0,329
|
2,663
|
9,57
|
0,019
|
5
|
218,50
|
5
|
0,941
|
0,256
|
1,645
|
5,91
|
0,140
|
6
|
263,41
|
5
|
1,203
|
0,193
|
1,030
|
3,70
|
0,455
|
7
|
308,32
|
4
|
1,423
|
0,144
|
0,659
|
2,37
|
1,126
|
8
|
353,23
|
4
|
1,614
|
0,108
|
0,430
|
1,55
|
3,892
|
9
|
398,14
|
2
|
1,782
|
0,081
|
0,287
|
1,03
|
0,908
|
ИТОГО:
|
80
|
10,81
|
Рис. 7
Нормальный закон распределения двухпараметрический, число степеней свободы υ = 6 и
= 12.592.
Так как χ2
< χ0,05
2
, то эмпирическая выборка значений принадлежит логарифмически-нормальному закону распределения
4. Определение вида теоретического закона распределения случайной величины графическими методами
Расчёт координат эмпирических точек заданной выборки
Таблица 8.
№ п/п
|
Среднее значение
интервала xi
, 103
км
|
fi
, шт
|
Σ fi
|
F(x)= Σ fi
/n+1
|
1
|
38,86
|
16
|
16
|
0,198
|
2
|
83,77
|
26
|
42
|
0,519
|
3
|
128,68
|
8
|
50
|
0,617
|
4
|
173,59
|
10
|
60
|
0,741
|
5
|
218,50
|
5
|
65
|
0,802
|
6
|
263,41
|
5
|
70
| |