Теория Справочник Практикум Контроль знаний Об авторах  



Лабораторная работа № 2.

Виды законов распределения случайных величин.

 

Цель работы: Произвести проверку нормальности результатов наблюдений.

Задание: Произвести сравнение закона распределения с нормальным, используя критерий согласия - Пирсона.

 

Краткие теоретические сведения. Для более точного определения соответствия эмпирического и теоретического распределений необходимо выбрать критерий их соответствия. Проверяемая гипотеза состоит в том, что величина x по данным выборки подчинена закону F(x). Выбирают меру (критерий) расхождения между предполагаемым теоретическим и эмпирическим распределениями. Если такая мера расхождения превосходит некоторый предел, гипотеза отклоняется.

Критерий согласия. В качестве меры расхождения принимается сумма квадратов разности частостей и теоретических вероятностей попадания результатов наблюдений в каждый интервал, взятых с некоторыми весовыми коэффициентами для каждого интервала:

где -суммарная мера расхождения;

      ci весовые коэффициенты разрядов (ci = n/ Pi);

      Pi* частость, полученная из гистограммы (экспериментальная вероятность);

      Pi теоретическая вероятность попадания случайной величины в данный интервал:

В практических задачах о проверке нормальности распределения значение Pi определяется по таблице, как

Мера расхождения U является случайной величиной и независимо от исходного распределения подчиняется c2 - распределению Пирсона с k степенями свободы при условии, что все частоты mi ³ 5, число измерений стремится к бесконечности, а веса выбирают равными . Число степеней свободы распределения: K = rs, где r - число разрядов интервалов гистограммы (при условии mi ³ 5), s - число независимых связей, наложенных на частости Pi.

Если проверяется гипотеза о нормальности распределения, к числу этих связей относятся:

поэтому при определении нормальности распределения принимается:   s = 3.

Мера расхождения по Пирсону, обозначается ck2 и имеет следующее выражение:

где c - мера расхождения в каждом интервале.

Для проверки гипотезы о нормальности распределения или соответствии предполагаемому закону распределения значение ck2 сравнивают с границами интервала для ck2, определяемого по таблице для принятой доверительной вероятности a = 1 – q. Этими границами будут значения:  

 

Если мера расхождения ck2, вычисленная по формуле 4 окажется в указанном интервале, то гипотеза принимается. Это, безусловно, не означает, что гипотеза верна. Можно лишь утверждать, что она правдоподобна, т.е. не противоречит опытным данным. Если же ck2 выходит за границы доверительного интервала, то гипотеза отвергается как противоречащая опытным данным.

Ошибкой первого рода называют такое решение, которое отвергает в действительности правильную гипотезу. Вероятность совершения такой ошибки называют уровнем значимости. При выбранной доверительной вероятности a эта вероятности будет равна:

Но мы можем совершать ошибку второго рода, приняв в действительности неверную гипотезу за верную. Вычислить вероятность такой ошибки, строго говоря, невозможно, можно лишь утверждать, что при уменьшении ошибки первого рода ошибка второго рода увеличивается. Отсюда следует вывод, что не имеет смысла брать слишком высокие значения доверительных вероятностей.

 

Порядок выполнения:

 

Порядок проверки нормальности распределения по критерию c2  при n ³ 40 следующий.

 1. Производится разбиение графика на число интервалов, соответствующее экспериментально построенной гистограмме. Иначе говоря, результаты наблюдений группируют по интервалам, после определяют частоты mi (mi – число значений, попавших в данный интервал). Интервалы, в которых mi < 5, объединяют с соседними. Число степеней свободы при этом уменьшается.

2. Вычисляют оценки параметров распределения (среднее значение) и SX,(СКО) которые принимают в качестве параметров нормального теоретического распределения.

где n – количество интервалов.

3. Для каждого интервала находят вероятности попадания в него по формуле 3.

4. Вычисляют для каждого интервала меру расхождения ci2 и суммируют их значения.

5. Определяют число степеней свободы k = r - 3 для нового числа интервалов и, задаваясь уровнем значимости q, находят границы .

Таблица 3

Исходные и расчетные данные

i

Границы интервалов

mi

Pi

nPi

xiH

xiB

 

 

 

 

 

 

 

 

Оценка нормальности распределения при п < 40. При малом числе наблюдений для оценки нормальности применяют статистическую функцию распределения результатов наблюдений. Для ее построения результаты наблюдений формируют в виде вариационного ряда: X(1), Х(2), ..., Х(n), члены которого располагаются в порядке возрастания таким образом, что всегда соблюдается условие X(1)  £ Х(2) £ ... £ Х(n). Значение ступенчатой функции распределения определяется по формуле

Скачок ступенчатой функции распределения равен m/(n + 1), где m — число повторений одинаковых значений величины по результатам наблюдений. Напомним, что при увеличении n Fnk) сходится по вероятности к интегральной функции распределения.

Для каждого значения Хk будет найдено значение Fnk), которому, в свою очередь, соответствует значение z, если принять Fnk) =Ф(zk). Поскольку переменная величина z определяется через результаты наблюдений как

то zk и Xk связаны линейной зависимостью.

Следовательно, при нормальном законе распределения точки zk и Xk, нанесенные на графике в координатах x и z, должны расположиться вдоль одной прямой линии. Если же получится кривая линия, то гипотеза о нормальности распределения отвергается как противоречащая опытным данным.

 

Таблица 4

xk

mk

Fn (Хk) =Ф(zk)

zk

 

 

 

 

 

 

Лабораторная работа №2

-число измерений

-математическое ожидание

- среденее квадратичное отклонение

-генератор случайных чисел

-максимальное значение в выборке

-минимальное значение в выборке

-количество интервалов

Вычисление среднего значения

Вычисление С К О

-задание доверительного интервала для сортировки

-выборка элементов, попадающих внутрь заданного интервала

-выборка элементов, не попадающих внутрь заданного интервала

-число элементов, попадающих внутрь заданного интервала

-число элементов, попадающих внутрь заданного интервала

-количество интервалов

Анализ сортировынных данных

1 Первый начальный момент

2 Первый центральный момент

3 Второй центральный момент

Среднее квадратичное отклонение

4 Третий центральный момент

5 Четвёртый центральный момент

Коэффициент асимметрии

Коэффициент эксцесса

-теоретическая вероятность

Теория | Справочник | Практикум | Контроль знаний | Об авторах |