Критерий Колмогорова

ursul

Все делается в экселе. Существует набор данных (120 шт). Подсчитаны МатОж(М Дисперсия(D СтОткл (q Ассиметрия, Эксцесс.
Данные разбиты на десять равных интервалов. Посчитано кол-во попаданий в каждый интервал (Nэмп).
Подсчитаны t1 и t2 для каждого интервала. t1 - (нач точка интервала - МатОж)/СтОткл. t2 - аналогично для конечной точки интервала.
Получены Ф(t1) и Ф(t2) - нормраспр для t1 и t2.
Получена вероятность для каждого интервала р=Ф(t2)-Ф(t1).
Подсчитано Nтеор( = р * 120) для каждого интервала.
ПОЛУЧЕН КРИТЕРИЙ ПИРСЕНА - Сумм([(Nэмп-Nтеор)^2]/Nтеор)
ВНИМАНИЕ, ВОПРОС: Критерий Колмогорова по данным различных учебных пособий и лекций товарища Воробьева находится с помощью эмпирической и теоретической функций распределения . Далее все ясно, но я не могу понять как, от каких данных и с помощью какой функции в экселе мне искать эти значения? кто разбирается подскажите, меня заклинило.

Julia080682

Статистика Колмогорова: \[K_{m}(x)=\sup_{u}|\hat{F}_{m}(u)-F_{0}(u)|\;\;\;\;\;(*)\]
$F_{0}(u)$ непрерывна и монотонна, $\hat{F}_{m}(u)$
кусочно-постоянна, поэтому для вычисления $K_{m}(x)$ достаточно
вычислить $(*)$ в окрестностях точек $x_{(i)}$:
\[K_{m}(x)=\sup_{x_{i}}\{|\frac{i-1}{m}-F_{0}(x_{i})|;|\frac{i}{m}-F_{0}(x_{i})|\}\;\;\;(*)\]
В экселе и вычисляешь эти разности, берёшь максимальную по модулю.

ursul



Статистика Колмогорова: \[K_{m}(x)=\sup_{u}|\hat{F}_{m}(u)-F_{0}(u)|\;\;\;\;\;(*)\]
$F_{0}(u)$ непрерывна и монотонна, $\hat{F}_{m}(u)$
кусочно-постоянна, поэтому для вычисления $K_{m}(x)$ достаточно
вычислить $(*)$ в окрестностях точек $x_{(i)}$:
\[K_{m}(x)=\sup_{x_{i}}\{|\frac{i-1}{m}-F_{0}(x_{i})|;|\frac{i}{m}-F_{0}(x_{i})|\}\;\;\;(*)\]
В экселе и вычисляешь эти разности, берёшь максимальную по модулю.
смеешься? я ничего не поняла из того что ты сказала. кроме последнего:"
В экселе и вычисляешь эти разности, берёшь максимальную по модулю." причем последнее как раз и так понятно! нужно именно то из чего сорставлять разность, а как это найти я с твоих слов не поняла. Если что - речь идет не о макросе, а о командной строке ячеек и списке функций екселя.

Julia080682

Это всего лишь код формул в ТеХе 8)

Julia080682

Хорошо, попробую так:
Эмпирическая функция распределения кусочно-постоянна, имеет конечное число скачков. Значит, статистика Колмогорова может быть вычислена как максимум модулей разности эмпирической и теоретической функций распределения справа и слева от точек разрыва.

ursul



код формул в ТеХе
либо я щас найду и разберусь что это такое либо не разберусь
на всякий случай объясни что ты имела в виду тк такое словосочетание вижу в первый раз и тогда уж понадобиться объяснение кода формул (вопрос какие же это фомулы) в TeXe...

ursul



Эмпирическая функция распределения кусочно-постоянна, имеет конечное число скачков. Значит, статистика Колмогорова может быть вычислена как максимум модулей разности эмпирической и теоретической функций распределения справа и слева от точек разрыва.
о, спасибо!
только это - "быть вычислена как максимум модулей разности " понятно! мне нужно из чего делать эту разность я торможу...

Julia080682

Знаешь, что такое ТеХ?

Julia080682

Так, всё, сабж уже не актуален?

ursul



что такое ТеХ?
нет=(

ursul



всё, сабж уже не актуален?
актуален.. погоди пока - см измененный пост..

Julia080682

У эмпирической функции распределения есть n точек разрыва. В каждой точке существуют пределы справа и слева. Они, соответственно, разные. Рассматриваешь каждую точку разрыва. Например, в том же экселе пишешь их в столбик. Напротив вычисляешь значения теоретической функции распределения в этих точках. Потом составляешь по две разности для каждой точки: значение теоретической функции распределения в этой точке минус значение предела слева в этой точке эмпирической функции распределения и значение теоретической функции распределения в этой точке минус значение предела справа в этой точке эмпирической функции распределения. Среди этих 2n разностей нужно выбрать максимальную по модулю. Это и есть значение статистики Колмогорова.

ursul



Напротив вычисляешь значения теоретической функции распределения в этих точках.
Это оно?


Данные разбиты на десять равных интервалов. Посчитано кол-во попаданий в каждый интервал (Nэмп).
Подсчитаны t1 и t2 для каждого интервала. t1 - (нач точка интервала - МатОж)/СтОткл. t2 - аналогично для конечной точки интервала.
Получены Ф(t1) и Ф(t2) - нормраспр для t1 и t2.
Те значения теоретической функции уже подсчитаны? разве? с помощью функции НОРМРАСП?

Julia080682

с помощью НОРМРАСП.

ursul

может тебе на почту прислать то что уже сделано? а то кажется у нас возникло некое недопониманиме...

Julia080682

так у тебя же всё понятно вроде 8)
смотри, вы посчитали во всех t1 и t2 эмпирическую функцию распределения. в этих же точках считаете НОРМРАСП. вычитаете и берёте максимум)

ursul



смотри, вы посчитали во всех t1 и t2 эмпирическую функцию распределения. в этих же точках считаете НОРМРАСП.
но это как раз и есть -


во всех t1 и t2 эмпирическую функцию распределения.
понимаешь? что либо я сильно торможу либо ты не совсем точно объясняешь...

ursul






















































С minC maxdC
1.063.960.29
Интервалы Nэмпt1t2Ф(t1)Ф(t2)pNteor [(Nэмп-Nтеор)^2]/Nтеор
10.00011.060-4.32314-2.552487.69128E-060.0053480.005340.64083 0.640830018
21.061.354-2.55248-2.068010.0053479410.019320.0139721.676592 3.219759607
31.351.644-2.06801-1.583540.0193195430.0566490.037334.479572 0.051341781
41.641.939-1.58354-1.099070.0566493090.1358690.079229.506376 0.026973077
51.932.2213-1.09907-0.61460.1358691050.269410.13354116.02493 0.570999168
62.222.5128-0.6146-0.130130.2694102190.4482330.17882321.45873 1.993974382
72.512.820-0.130130.3543440.4482330.6384590.19022622.82717 0.350147213
82.83.09170.3543440.8388150.6384593850.7992130.16075419.29047 0.271961247
93.093.38100.8388151.3232850.7992133160.907130.10791612.94997 0.671996308
103.383.67101.3232851.8077560.9071297470.9646780.0575486.905762 1.386423018
113.673.9651.8077562.2922270.9646777650.9890540.0243762.925115 1.47178785
123.96100002.2922271666.2660.98905372210.0109461.313553 1.313553384
Критерий Пирсена X^2
120 0.999992119.9991 11.96974705

ursul

Теперь просто разность Ф(t1)-Ф(t2) будет той самой? что то странно как-то...
Или ответ найден...

Julia080682

Тебе нужно вычислить эмпирическую функцию распределения. Потом считать разности.
Есть 120 наблюдений (120 точек по ним в каждой точке действительной прямой эмпирическая функция распределения считается как число наблюдений, попавших на действительную прямую левее этой точки, делённое на общее число наблюдений.

ursul



Тебе нужно вычислить эмпирическую функцию распределения. Потом считать разности.
Есть 120 наблюдений (120 точек по ним в каждой точке действительной прямой эмпирическая функция распределения считается как число наблюдений, попавших на действительную прямую левее этой точки, делённое на общее число наблюдений.
да. это понятно. более того - сделано...

ursul

давай лучше по почте разберемся?..тут явно недопонимание.. или я жуткий тормоз что мне нужно именно по почте..

Julia080682

тебе нужно вычислить статистику Колмогорова, чтобы применить критерий Колмогорова.

Julia080682

А она вычисляется как максимум модулей разности Ф(ti) и вычисленной эмпирической функции распределения. Получишь значение - число.

ursul



А она вычисляется как максимум модулей разности Ф(ti) и вычисленной эмпирической функции распределения. Получишь значение - число.
черт. ты не понимаешь что конкретно мне непонятно.. про число то как раз понятно...

ursul

кажется все гораздо проще -
























































Fэмп Fтеор I Fэмп - Fтеор Iкорень из 120
00.080.08333333310.95445115
0.0333330.1666670.133333333 
0.0666670.250.183333333 
0.1416670.330.191666667 
0.250.4166670.166666667 
0.4833330.500.016666667 
0.650.5833330.066666667 
0.7916670.6666670.125 
0.8750.750.125 
0.9583330.8333330.125 
10.9166670.083333333 
11.000 
 max=0.191666667 
  Критерий Колмогорова(1,35/10,95)=
0.123237575< 0.19166
  следовательно величина С распределена
  по нормальному закону, а отклонения случайны


Причем в командной строке Fэмп1(2,3,4,...12) = сумма всех предыдущ Nэмп/120, а в командной строке Fтеор1(2,3,4,...12) = 1(2,3,4...12)/12
 
? так ли?

Julia080682

Думаю, что всё-таки нет. Статистика Колмогорова вычисляется по-другому. По крайней мере, величина C охватывает 120 испытаний, поэтому её распределение вычисляется на основе 120, а не 12 опытов.

ursul



















































Вот получилось=)




p эмп






F эмп






F теор






I Fэмп - Fтеор I






корень из 120
00.000.0053480.00534794110.95445115
0.0333330.030.019320.01401379
0.0333330.070.0566490.010017358
0.0750.140.1358690.005797562
0.1083330.250.269410.019410219
0.2333330.480.4482330.035100334
0.1666670.650.6384590.011540615
0.1416670.790.7992130.007546649
0.0833330.880.907130.032129747
0.0833330.960.9646780.006344432
0.0416671.000.9890540.010946278
01.0012.22045E-16
max=0.035100334
Критерий Колмогорова (P95 %)/\=[b][/b]
[b][/b][b][/b][b][/b]0.123237575>0.035100334



В командных строках:
р эмп = N эмп/120эмп
Fэмп i = Fэмп(i - 1) + p эмп i
Fteor i = НОРМСТРАСП (t2 i)