Критерий Лиллиефорса — статистический критерий, названный по имени Хьюберта Лиллиефорса, профессора статистики Университета Джорджа Вашингтона, являющийся модификацией критерия Колмогорова–Смирнова. Используется для проверки нулевой гипотезы о том, что выборка распределена по нормальному закону для случая, когда параметры нормального распределения (математическое ожидание и дисперсия) априори неизвестны.
Проверка гипотезы проводится следующим образом:
Основным источником погрешности критерия Лиллиефорса является то обстоятельство, что параметры теоретического распределения оцениваются по тем же самым данным, которые проверяются на соответствие распределению. Таким образом, максимальное отклонение будет меньше, чем в случае, когда параметры распределения оцениваются независимо. Поэтому «нулевое распределение» статистики критерия, т.е. распределение вероятности в предположении об истинности нулевой гипотезы, оказывается смещено в сторону меньших значений по сравнению с распределением Колмогорова. Оно известно как «распределение Лиллиефорса» и рассчитывается методом Монте-Карло.
Содержание |
В оригинальной статье 1967 года[1] Лиллиефорс даёт следующую таблицу, полученную методом Монте-Карло. В таблице указаны критические значения максимального отклонения выборочной интегральной функции распределения от теоретической. В случае, если для выборки объёмом N при уровне значимости α максимальное отклонение превышает указанную в таблице величину, нулевую гипотезу о соответствии выборки нормальному распределению следует отвергнуть.
При объёме выборки N>30 критические значения убывают обратно пропорционально квадратному корню из объёма выборки, поэтому их можно с достаточной точностью найти по формуле
где значения λα0 указаны в формулах последней строки таблицы.
Размер выборки N |
Уровень значимости для D = Max|F * (X)–SN(X)| | ||||
---|---|---|---|---|---|
0,20 | 0,15 | 0,10 | 0,05 | 0,01 | |
4 | 0,300 | 0,319 | 0,352 | 0,381 | 0,417 |
5 | 0,285 | 0,299 | 0,315 | 0,337 | 0,405 |
6 | 0,265 | 0,277 | 0,294 | 0,319 | 0,364 |
7 | 0,247 | 0,258 | 0,276 | 0,300 | 0,348 |
8 | 0,233 | 0,244 | 0,261 | 0,285 | 0,331 |
9 | 0,223 | 0,233 | 0,249 | 0,271 | 0,311 |
10 | 0,215 | 0,224 | 0,239 | 0,258 | 0,294 |
11 | 0,206 | 0,217 | 0,230 | 0,249 | 0,284 |
12 | 0,199 | 0,212 | 0,223 | 0,242 | 0,275 |
13 | 0,190 | 0,202 | 0,214 | 0,234 | 0,268 |
14 | 0,183 | 0,194 | 0,207 | 0,227 | 0,261 |
15 | 0,177 | 0,187 | 0,201 | 0,220 | 0,257 |
16 | 0,173 | 0,182 | 0,195 | 0,213 | 0,250 |
17 | 0,169 | 0,177 | 0,189 | 0,206 | 0,245 |
18 | 0,166 | 0,173 | 0,184 | 0,200 | 0,239 |
19 | 0,163 | 0,169 | 0,179 | 0,195 | 0,235 |
20 | 0,160 | 0,166 | 0,174 | 0,190 | 0,231 |
25 | 0,149 | 0,153 | 0,165 | 0,180 | 0,203 |
30 | 0,131 | 0,136 | 0,144 | 0,161 | 0,187 |
Более 30 |
Для критерия Лиллиефорса, так же как и для критерия Колмогорова, критические значения для больших выборок убывают обратно пропорционально квадратному корню из объёма выборки. Коэффициенты λα0, фигурирующие в этой формуле могут служит показателем относительной величины критических отклонений для этих двух распределений.
Как показывают данные, приведённые в таблице, критические значения критерия Лиллиефорса примерно в 1,5 раза меньше, чем соответствующие значения для критерия Колмогорова. Это связано с тем, что параметры теоретической кривой для критерия Лиллиефорса вычисляются исходя из той же самой исходной выборки. Таким образом, по сравнению с критерием Колмогорова, теоретическая кривая искусственно «подогнана» под выборку, что даёт заниженные значения отклонений.
Критические значения λα0 для распределений: |
Уровень значимости α | |||
---|---|---|---|---|
0,20 | 0,10 | 0,05 | 0,01 | |
Распределение Колмогорова | 1,073 | 1,224 | 1,358 | 1,627 |
Распределение Лиллиефорса | 0,736 | 0,805 | 0,886 | 1,031 |
Критерий Лиллиефорса.