Теория Справочник Практикум Контроль знаний Об авторах  



Лабораторная работа № 3

 

Обработка однофакторных измерений

 

Цель работы: Определить методом наименьших квадратов параметры функциональной зависимости.

Задание: Определить параметры функциональной зависимости по результатам многократных измерений.

 

Краткие теоретические сведения о методе наименьших квадратов.

Если из теоретических соображений можно считать, что между х и у существует линейная зависимость, то для интерполяции следует искать не какую-то функцию, лучше  всего  удовлетворяющую данным точкам, а прямую линию менее всего уклоняющуюся от них. Уравнение искомой прямой может быть записано в виде:  y = ax + b.  Коэффициенты уравнения (а и b) надлежит выбрать наилучшим  образом.  Для  нахождения  по способу наименьших  квадратов  уравнение  искомой  прямой поступим следующим образом: проведем ординаты точек xi,yi до их пересечения с искомой прямой (см. рис.). Значение этих ординат будет равно (axi + b). Расстояние по ординате от точки xi, yi  до прямой равно (axi + b - yi).

Положим, что прямая будет наилучшей, если сумма квадратов всех расстояний (axi + b-yi) имеет наименьшее значение:

Минимум этой суммы ищется по правилам дифференциального исчисления. Для нахождения коэффициентов а и b искомой прямой мы должны  найти   минимум   суммы:

.

Поэтому приравниваем нулю производные этой суммы по параметрам а и b:

                           (1)

Отсюда легко выводим

                           (2)

Такая система уравнений называется нормальной и легко решается относительно параметров а и b:

            (3)

Суммирование производится по всем точкам. Теория дает возможность определить дисперсию уклонения точек от прямой зависимости и дисперсию коэффициентов а и b . Если S02 -дисперсия точек, Sa2 и Sb2 - дисперсия коэффициентов а и b , тогда

              (4)

Если разделить числитель и знаменатель в этих формулах на n2, то получим

       (5)

 

Подбор аппроксимирующей функции.

 

Рассмотрим 3 класса элементарных функций, как наиболее часто встречающихся.

1)      Степенная функция.


,        c = n,     m = lnx

          2) Показательная функция.

 





3) Дробно-рациональная функция.

  



Порядок выполнения работы:

  1. Получить массив данных для не менее 50 числа точек, которые можно взять, например, из примера St_lab3.
  2. Свести функцию, данную преподавателем к линейной (см. Подбор апроксимирующей функции). При этом необходимо рассчитать коэффициенты полученной линейной зависимости по формулам (5).
  3. Совершить обратный переход от линейной функции с рассчитанными коэффициентами к исходной функции, изменив при этом коэффициенты.
  4. Определить по формулам (4) дисперсии: S02 – дисперсию точек, Sa2 и Sb2 - дисперсии коэффициентов а и b.
  5. Построить график с коэффициентами а и b и показать его предельные отклонения в соответствии с Sa2 и Sb2                

Лабораторная работа №3

-число точек измерений

-число измерений в одной точке

-минимальное значение x

-максимальное значение x

- среденее квадратичное отклонение

 

- генератор данных

- коэффициенты полученного полинома

Лабораторная работа № 4

Совместная обработка нескольких рядов наблюдений

 

Цель работы: Оценить равнорассеянность результатов ряда наблюдений.

Задание: Произвести совместную обработку результатов наблюдений (равноточных и неравноточных).

 

Краткие теоретические сведения.

До сих пор мы рассматривали обработку данных од­ной выборки, принадлежащей одной генеральной совокупности. Результаты наблюдений х были получены одним или группой на­блюдателей с помощью одних и тех же методов и средств измере­ний в неизменных условиях внешней среды. Такие результаты яв­ляются равнорассеянными, т. е. одинаково распределенными слу­чайными величинами. Однако во многих случаях результаты измерений могут быть представлены несколькими сериями наблюдений, полученных при раз­ных условиях, с помощью различных средств измерений и т.п. В этих случаях необходимо решить две задачи: во-первых — произвести оценку равноточности серий наблюдений и в случае отрицательного заключения решить вторую задачу — произвести статистическую обработку полученных неравноточ­ных результатов.

Рассмотрим решение первой задачи.

Пусть имеем две выборки объемом n1 и n2, для которых опре­делены оценки параметров распределения: . Для проверки гипотезы о равнорассеянности наблюдений применим критерий Фишера. Распределению Фишера подчиняется от­ношение

в котором независимые случайные величины u и v подчиняются c2-распределению с k1 и k2 степенями свободы соответственно.

Распределение Фишера задается в табличной форме в зависимости от числа степеней свободы k1 для большей дисперсии S12 и числа k2 для меньшей дисперсии при определенных значениях доверительной вероятности (a = 1- q) или уровня значимости (q), априорно принимаемых при проверке гипотезы о равнорассеянности дисперсий (см. табл. П. 6).

Условие принятия гипотезы о равнорассеянности выражается следующим неравенством:

,

т. е. если при выбранном уровне значимости (q) отношение большей дисперсии к меньшей будет меньше значения , получен­ного из таблицы распределения Фишера, то это означает, что различие оценок незначимо и они являются двумя независимыми оценками одной и той же дисперсии.

Другой способ оценки равноточности дисперсий заключается в нахождении доверительных границ для истинной дисперсии. Нижнюю и верхнюю границы для значений дисперсий находим по следующим формулам:

Границы для значений дисперсии определяем при проверяемых эмпирических дисперсиях S12 и S22 и соответствующих им степенях свободы. Если полученные интервалы [S1H2; S1B2] и [S2H2; S2B2] перекрыва­ются, измерения можно считать равноточными.

В общем случае при наличии j-групп результатов наблюдений оценки параметров распределения определяется для каждой j-й группы.

Равнорассеянность групп наблюдений проверяется методами математической статистики, известными под общим названием методы дис­персионного анализа.

Гипотезу о равнорассеянности результатов наблюдений про­веряют в два этапа.

Этап 1. Проверяется гипотеза о равноточности эмпирических дисперсий Sj2 во всех группах наблюдений. Для этого их распо­лагают в вариационный ряд S12, ..., S(i)2 в порядке возрастания и проверяют значимость их парных отношений.  Если отношение дисперсий незначимо, то гипотезу о равноточ­ности в этом случае считают правдоподобной, а дисперсии относи­тельно средних — одинаковыми. Если отношение значимо, ги­потезу отвергают и проверяют отношения дисперсий для других групп наблюдений.

Этап 2. При положительном результате этапа 1 необходимо проверять гипотезу о равенстве математических ожиданий во всех группах. При малом числе групп наблюдений обычно не применяют рас­пределение Фишера для дисперсионного анализа отношений дис­персии групповой к дисперсии среднего арифметического. В этом случае вычисляют квантиль (t1-2) на основании двух средних арифметических:

Если результаты наблюдений распределены нормально, то t1-2 имеет распределение Стьюдента с (n1+n2-2) степенями свободы, асимптотически переходящее в нормальное при большом числе на­блюдений.

Задаваясь уровнем значимости (q =  1 – Р) или доверительной вероятностью (Р), можно найти предельное значение tP, и если t1-2 < tP то гипотеза о равенстве мате­матических ожиданий принимается.

Распределением Стьюдента пользуются и в том случае, когда проверка равенства дисперсий в группах дала отрицательные результаты. Тогда необходимо проверить разность средних арифметических для всех вариантов сочетаний групп, поскольку незначимость различия между   и  в группах еще не означает, что между другими средними различия тоже будут незначительными. Причиной этого является различие дисперсий в отдельных группах наблюдений. Если оба этапа проверки показали, что и оценки эмпирических дисперсий Sj2, и оценки математических ожиданий , незначимо отличаются друг от друга, то группы наблюдений считаются равнорассеянными. При этом все результаты можно объединить и обрабатывать как одну большую выборку. Естественно, что новые оценки параметров распределения позволяют дать большую достоверность результату измерения. Значимое различие групповых средних , говорит о том, что на формирование результатов оказывает влияние сильнодей­ствующая причина или ряд причин (факторов). В связи с этим следует провести анализ условий измерения, попытаться найти причины система­тических погрешностей, определить их значения и ввести поправки в соответствующие результаты. В том случае, когда различие дисперсий значимо, а различие средних арифметических незначимо, группы результатов называ­ются неравнорассеянными.

 

Номер наблюдения

Группы наблюдений

1

2

3

 

 

 

 

 

 

 

 

Группы наблюдений называются неравнорассеянными (неравноточными), если оценки их дисперсий значимо отличаются друг от друга, а средние арифметические являются оценками од­ного и того же математического ожидания. Вопрос состоит в следующем: нельзя ли объединить резуль­таты нескольких групп наблюдений, несмотря на то что их диспер­сии различны.

Для демонстрации целесообразности объединения результа­тов рассмотрим пример с результатами измерения, полученными в двух равнорассеянных группах наблюдений с различным числом наблюдений n1 и n2. Результат измерения в каждой группе будет записан как:

где sX — среднее квадратическое отклонение, определенное за­ранее для данного метода и условий измерения.

 При объединения всех результатов в одну выборку, получим результат:

из которого следует, что точность общего результата повысится в результате объединения отдельных групп наблюдений. Особенно это очевидно при n1 = n2, так как при этом среднее квад­ратическое отклонение среднего арифметического объединенного результата будет в  раз меньше группового.

Рассмотрим другой пример, когда получены два результата измерения одной и той же величины различными измерительными средствами и в различных условиях.

Для решения этой задачи вводят понятия веса результата каж­дого измерения и среднего взвешенного объединенных результатов измерений.

Применением принципа максимального праводоподобия, в соот­ветствии с которым наилучшей оценкой для неизвестного истинного значения будет такая оценка, вероятность которой максимальна, определена наилучшая оценка истинного значения по результа­там j - групп, которая имеет следующее выражение:

Величины, обратные дисперсиям результатов наблюдений, на­зывают весами оценок истинного значения измеряемой величины.

Обозначив веса в виде:

получим:

Данная оценка истинного значения  называется средним взвешенным.

Веса характеризуют степень влияния результата измерения определенной группы результатов наблюдения на взвешенное среднее и являются коэффициентами влияния размеров  на .

Иногда применяют безразмерные относительные весовые коэф­фициенты:

для которых удовлетворяется условие

В этом случае выражение для среднего взвешенного примет вид:

Дисперсия взвешенного среднего определяется как обратная величина суммы весов результатов измерения:

,

а его среднее квадратическое отклонение:

Если дисперсии результатов наблюдений неизвестны, то для  расчета применяют их оценки, полученные на основе результатов наблюдений. Доверительная граница для погрешности результата измерения в случае, если nj = 20…30 определяется величиной , где tP = z и определяется по таблице для нормированного нормального распределения по заданной доверительной вероятности. При малых числах результатов наблюдений в группах для определения tP пользуются распределением Стьюдента с числом степеней свободы

Если распределения исходных данных неизвестны, то на основании центральной предельной теоремы теории вероятности можно предположить, что распределение среднего взвешенного нормально, поскольку оно является суммой большого числа случайных величин с конечными дисперсиями и математическими ожиданиями.

Порядок выполнения работы:

1. Использовать четыре массива данных (можно взять значения из St­_lab, предварительно задав для каждого из них своё математическое ожидание и СКО).

2. Для каждого из массивов определить значения дисперсий и СКО.

3. Вычислить отношения дисперсий для массивов (1-2, 1-3, 1-4, 2-3, 2-4, 3-4) и найти подобные значения по таблице Фишера(см.приложение1) в заданном диапазоне для оценки уровня значимости при заданных степенях свободы.

4. Записать результат измерения для каждой группы, а затем объединить все результаты в одну выборку.

5.  Найти значение средневзвешенной дисперсии.

6. Найти значения весовых коэффициентов для каждого массива данных, как отношение средневзвешенного СКО к СКО каждого интервала.

7.  Найти средневзвешенное значение .

8. Записать результаты, полученные при двух способах оценки истинного значения и сравнить.

 

Теория | Справочник | Практикум | Контроль знаний | Об авторах |