Обработка результатов экспериментов и наблюдений

практическое значение. Рассмотрим некоторые из них по условиям

возникновения и основным параметрам их характеризующим.

1. Равномерное распределение вероятностей.

Пусть плотность вероятности А равна нулю всюду, кроме интервала (a;

b), на котором она постоянна (рис. 6). Тогда можно записать

p (a < X < b) = [pic] [pic] A = [pic].

Рис. 6. Дифференциальный и интегральный законы

равномерного распределения

Тогда дифференциальный закон равномерного распределения определяется

( (x) = [pic][pic]

Интегральный закон распределения

F (x) = [pic].

При х ( b имеем

F (x) = [pic]

Таким образом интегральный закон равномерного распределения задается

(рис. 6)

F (x) = [pic]

Основные характеристики распределения

М (X) = [pic];

D(X) = [pic]

= [pic]

[pic].[pic]

2. Биноминальное распределение

Пусть при некотором испытании событие А может наступить или не

произойти (А). Обозначим вероятность А через р, а А через q ( 1 (р ( других

итогов испытания нет ). Тогда исходами двух последовательных независимых

испытаний и их вероятностью будут:

АА ( р2; АА ( рq; АА ( qр; АА ( q2.

Отсюда видно, что двукратное появление события А равно р2,

вероятность однократного появления ( 2 рq, а вероятность того, что А не

наступит ни разу ( q2. Эти результаты единственно возможные и поэтому

[pic].

Это рассуждение можно перенести на любое число испытаний.

Например, при трех испытаниях получим

[pic].

Подсчитаем вероятность того, что при n испытаниях событие А появится m

раз. Это может произойти, например, в последовательности

[pic]

Ясно, что вероятность равна рmqn(m. Но m событий А может быть и в другом

сочетании. Число всех возможных сочетаний из n элементов по m (количество

событий А) равно числу сочетаний [pic]. Используя теорему сложения

вероятностей получаем общую вероятность Рm,n наступления m событий А из n

испытаний

Pm,n = [pic]

= [pic].

Из этой формулы видно, что вероятности Рm,n для различного исхода

испытаний (появление или не появление определенного результата А)

определяется

pn + npn-1q + [pic].

Коэффициенты перед вероятностями р, q являются биноминальными

коэффициентами, а общая вероятность представляет слагаемые в разложении

бинома ( р ( q )n. Поэтому закон распределения случайной величины Х, в

котором вероятность наступления событий А определяется коэффициентами

бинома, называется биноминальным распределением дискретной случайной

величины. Этот закон может быть задан в виде таблицы 1.

Таблица 1

Биноминальный закон распределения

| | | | | | | | |

|хi |0 |1 |2 |... |m |... |n |

| | | |[pic] | | | | |

|pi |qn |npqn-1 | |... |[pic] |... |pn |

Биномиальные коэффициенты удобно получать с помощью треугольника

Паскаля.

1 n ( 0

1 1 n ( 1

1 2 1 n = 2

1 3 3 1 n = 3

1 4 6 4 1 n = 4

1 5 10 10 5 1 n = 5

Все строки треугольника ( начинающегося с единицы ) начинаются и

заканчиваются единицей. Промежуточные числа получаются сложением соседних

чисел вышестоящей строки. Числа, стоящие в одной строке, являются

биноминальными коэффициентами соответствующей степени.

Из описания биномиального распределения становится ясно, что область

его действия там, где возможно многократное проведение испытаний с

известной вероятностью.

На рис. 7 представлен биномиальный закон распределения.

Рис. 7. Биномиальный закон распределения

Определим основные характеристики этого распределения.

Математическое ожидание

М (Х) = [pic]

+ [pic]

= np (q + p)n-1 = np.

Дисперсия распределения может быть определена из общего выражения

[pic],

но это приводит к громоздким вычислениям. В то же время случайная величина

Х принимает в каждом опыте только два значения: 1, если событие А произошло

и 0, если оно не произошло с вероятностями, соответственно, р или q. Тогда

математическое ожидание одного опыта определится

М (Х1) = 0(q ( 1(р ( р ( х

и соответственно дисперсия одного опыта

D (Х1) = (0 ( р)2(q ( (1 ( р)2(р ( р2q ( q2р ( рq (р ( q) ( рq.

Тогда дисперсия всех n опытов составит

D (X) ( n(p(q.

3. Закон Пуассона

В случае малых р ( или, наоборот, близких к 1 ) биноминальный закон

распределения можно преобразовать следующим образом

[pic]

[pic],

где [pic].

[pic].

Определим предел Рm,n при n ( ( и постоянном m. Тогда пределы

[pic] равны единице, а [pic].

Окончательно имеем

[pic].

Это распределение называется законом Пуассона, где ( ( интенсивность

распределения. Используется в задачах с редкими событиями. На рис. 8

представлена схема вероятностей, распределенных по закону Пуассона.

Рис. 8. Закон распределения Пуассона

Определим его основные характеристики и смысл величины (.

Запишем закон распределения в виде таблицы.

| | | | | | | |

|хi |0 |1 |2 |... |m |... |

| | | [pic] | [pic] | | [pic] | |

|pi |e-( | | |... | |... |

M (X) = [pic]

+ [pic].

Выражение в скобках есть разложение функции е( в ряд Маклорена.

Поэтому

М (Х) ( (е((е( ( (.

Не рассматривая вывод отметим, что

D (Х) ( (,

т.е. дисперсия равна математическому ожиданию.

Рассмотренные виды распределений случайной величины, конечно, не

исчерпывают всех существующих распределений. Можно назвать еще несколько:

распределение Бернулли, экспоненциальное распределение, гамма (

распределение, распределение Вейбула, гипергеометрические распределения и

др. При определенных условиях и параметрах один вид распределения может

переходить в другой. Поэтому при решении практических задач по законам

распределения случайных величин следует обращаться к специальной

литературе.

4. Понятие статистической гипотезы и статистического критерия

Статистической гипотезой называют любое утверждение о виде или

свойствах распределения наблюдаемых в эксперименте случайных величин. Такие

утверждения можно делать на основе теоретических соображений или

статистических исследований других наблюдений. Например, при многократном

измерении некоторой физической величины, точное значение Х которой не

известно, но в процессе измерений оно меняется. На результат измерений

влияют многие случайные факторы, поэтому результат i ( го измерения можно

записать в виде аi = Х + (i, где (i ( случайная погрешность измерения. Если

(i складывается из большого числа ошибок, каждая из которых не велика, то

на основании центральной предельной теоремы можно предположить, что

случайные величины аi имеют нормальное распределение. Такое предположение

является статистической гипотезой о виде распределения наблюдаемой

случайной величины.

Если для исследуемого явления сформулирована та или иная гипотеза (

обычно ее называют основной или нулевой гипотезой и обозначают символом Но

), то задача состоит в том, чтобы сформулировать правило, которое позволяло

бы по результатам наблюдений принять или отклонить эту гипотезу. Правило,

согласно которому проверяемая гипотеза Но принимается или отвергается,

называется статистическим критерием проверки гипотезы Но .

Наиболее распространены такие статистические гипотезы, как:

а) вида распределения;

б) однородности нескольких серий независимых результатов;

в) случайности результатов эксперимента и т.п.

Статистический критерий проверки гипотезы Но служит для определения

возможного отклонения от основной гипотезы. Характер отклонений может быть

различным. Если критерий (улавливает( любые отклонения от Но, то такой

критерий называют универсальным или критерием согласия. Существуют

критерии, которые выявляют отклонения от заданного вида, это узко

направленные критерии.

Выбор правила проверки гипотезы Но эквивалентен заданию критической

области х1, при попадании в которую переменной х гипотеза Но отвергается.

Критерий, определяемый критической областью х1 называют критерием х1.

В процессе проверки гипотезы Но можно прийти к правильному решению

или совершить ошибку первого рода ( отклонить Но когда она верна, или

ошибку второго рода ( принять Но, когда она ложна. Иными словами, ошибка

первого рода имеет место, если точка х попадает в критическую область х1, в

то время как верна нулевая гипотеза Но, а ошибка второго рода ( когда х (

хо, но гипотеза Но ложна.

Желательно провести проверку гипотезы так, чтобы свести к минимуму

вероятности обоих ошибок. Однако при данном числе испытаний n в общем

случае невозможно одновременно обе эти вероятности сделать как угодно

малыми. Поэтому наиболее рационально выбирать критическую область следующим

образом: при заданном числе испытаний n устанавливается граница для

вероятности ошибки первого рода и при этом выбирается та критическая

область х1, для которой вероятность ошибки второго рода минимальна.

2.5. Вероятности ошибок первого и второго рода

Рассмотрим станок, который может работать только в одном из двух

состояний. Если он работает в налаженном режиме, то для интересующего нас

признака качества, например, длины или диаметра заготовки, имеет место

нормальное распределение при работе как в налаженном так и в разлаженном

режиме. Оба режима отличаются только уровнем настройки процесса по

математическому ожиданию ( М(х) = 10 и 11, соответственно в налаженном и

разлаженном режиме ), в то время как дисперсии в обоих случаях составляют

(2 = 4.

Проверить нужно нулевую гипотезу, в соответствии с которой М(х) = 10,

против альтернативы ( в данном случае единственной ) М(х) = 11.

Конкурирующую гипотезу обозначим Н1. Тогда Но: М(х) = 10; Н1: М(х) = 11.

Необходимо по результатам выборки определить в каком из состояний

работает станок. Примем объем выборки n из потенциально бесконечной

генеральной совокупности. В качестве контрольной величины возьмем

выборочное среднее Хn. На рис. 9 изображены плотности распределения Хn для

n = 25 и n = 4.

Для формулировки критерия необходимо разделить область изменения

контрольной величины (х) на критическую область отклонения гипотезы Но (

принятия Н1 ) и область принятия гипотезы Но. Для этого необходимо выбрать

число К, такое, что 10 ( К ( 11, и интервал ( ((; К ( рассматривать как

область принятия гипотезы Но, а интервал ( К; ( ) ( как область отклонения

гипотезы Но. По рис. 9 видно, что каждая реализация Х25 или Х4 возможна при

верности любой из двух гипотез, но с различной вероятностью. На рис. 9

указаны вероятности совершения ошибки первого

Рис. 9. Плотности распределения двух гипотез при различном

объеме выборки и одинаковой дисперсии

рода ( ( отклонения верной гипотезы Но ) и второго рода ( ( принятие

гипотезы Но, когда она не верна ). По рис. 9 также видно, что увеличение n

ведет к уменьшению дисперсии распределения х и тем самым ( к одновременному

уменьшению вероятностей ( и (. В соответствии с рис. 9 можно записать:

[pic];

[pic].

Эти два уравнения содержат четыре величины (, (, К, n. Задав две из

четырех величин, можно определить две другие.

Например, при n = 25 и К = 10,4 определим:

[pic];

[pic].

Если задаться величинами ( и (, то можно определить величины К, n.

2.6. Проверка гипотезы вида закона распределения вероятностей

При проверке эксперимента закон распределения вероятностей случайных

величин неизвестен и можно лишь предположительно судить о его виде .

Выборочные оценки параметров распределения несут в себе случайные ошибки,

искажающие истинный характер распределения. Поэтому после получения

эмпирического распределения производится подбор теоретического закона

распределения, пригодного для описания вероятностных свойств изучаемой

случайной величины. Критерии подбора ( проверки гипотезы соответствия )

называют в статистике критериями согласия. Все они основаны на выборе

допустимой меры расхождения между теоретическим распределением и

выборочными данными.

Общую процедуру проверки гипотезы закона распределения можно

представить в следующей последовательности:

По опытным данным строится эмпирическая кривая распределения вероятностей;

Определяются параметры эмпирического распределения ( в соответствии с его

видом );

Выдвигается одна или несколько гипотез о функции плотности исследуемой

случайной величины, исходя из внешнего вида эмпирической кривой, значений

ее параметров, технических факторов, влияющих на ее вид;

Эмпирическая кривая выравнивается по одной или нескольким теоретическим

кривым;

Проводится сравнение по одному или нескольким критериям согласия;

Выбирается теоретическая функция, дающая наилучшее согласование.

Поясним п. 4; 5. Определив по эмпирическим данным параметры

распределения, подставляют их в теоретическую кривую закона распределения и

рассчитывают вероятность середин интервалов эмпирического распределения.

Умножив значение полученной вероятности на общее число опытов, получают

теоретическое значение частот случайной величины, которые и определяют

(выровненную( кривую. Теперь можно найти вероятность того, что эмпирическая

кривая соответствует выбранной теоретической, выбрав вероятность согласия (

уровень значимости ). Если результат расхождения не выйдет за принятый

уровень значимости, то считают, что эмпирическое распределение согласуется

с теоретическим. Если сравнение осуществляется с несколькими теоретическими

законами, то окончательно принимать тот, который дает лучшее соответствие.

Чаще всего в качестве критериев согласия принимают критерий Пирсона (

(2 ) и критерий Колмогорова ( Смирнова ( К ( С ( критерий ).

Критерий (2 является наиболее состоятельным при большом числе

наблюдений. Он почти всегда опровергает неверную гипотезу, обеспечивает

минимальную ошибку в принятии неверной гипотезы по сравнению

с другими критериями.

(2 = [pic],

где mj ( наблюдаемая частота случайного события;

m(j ( ожидаемая по принятому теоретическому закону распределения;

К ( число интервалов случайной величины.

Затем определяется число степеней свободы l:

l = К ( r ( 1;

где К ( число интервалов случайной величины;

r ( число параметров теоретической функции распределения.

К ( С ( критерий лучше всего использовать в случае, если

теоретические значения параметров распределения известны. При неизвестных

параметрах его можно использовать, но он дает несколько завышенные

результаты. При использовании этого критерия определяется величина

[pic],

где

mнj, m*нj ( соответственно, накопленные наблюдаемые и ожидаемые

(теоретические) частоты;

n ( число проведенных опытов.

То есть, в данном случае оценивается только максимальное отклонение

накопленной частоты случайного события, возникающее в одном из диапазонов

изменения случайной величины. Полученное значение коэффициента сравнивается

с табличным для числа степеней свободы опыта и принятого уровня значимости

результата. Если табличное значение коэффициента больше, то гипотеза о

принятом законе распределения не отвергается.

Контрольные вопросы

1. Сущность непрерывной и дискретной случайной величины;

2. Сущность интегрального закона распределения случайной величины;

3. Сущность дифференциального закона распределения случайной величины;

4. Связь интегрального и дифференциального законов распределения;

5. Основные характеристики случайной величины, заданной своим

распределением;

6. Назовите примеры законов распределения непрерывной и дискретной

случайной величины;

7. Понятие статистической гипотезы и статистического критерия;

8. Назовите примеры статистических гипотез;

9. Сущность ошибок первого и второго рода;

10. Сущность проверки гипотезы вида закона распределения;

11. Принципиальное различие в критериях Пирсона и Колмогорова ( Смирнова.

3. НАХОЖДЕНИЕ ИНТЕРПОЛИРУЮЩИХ КРИВЫХ

В первой части пособия рассматривались измерения той или иной

физической величины, находящейся при проведении серии измерений в

неизменном состоянии. Очень часто исследуемая величина меняется в

соответствии с изменением условий опыта или времени. Цель эксперимента в

этом случае состоит в нахождении функциональной зависимости, которая

наилучшим образом описывает изменение интересующего нас параметра.

Следует понимать, что однозначно восстановить ( большей частью

неизвестную ) функциональную зависимость между переменными невозможно даже

в том случае, если бы переменные величины, полученные из опыта, не имели бы

ошибки измерения. Тем более не следует ожидать, что это удастся сделать,

имея экспериментальные данные, содержащие, по крайней мере, случайные

ошибки измерений.

Поэтому математическая обработка результатов наблюдений не может

ставить перед собой задачу разгадать истинный характер зависимости между

переменными. Она позволяет лишь представить результаты опыта в виде

наиболее простой формулы.

В зависимости от назначения этих формул существуют различные методы

их получения, отличающиеся сложностью расчетных процедур и точностью

получаемых решений.

1. Графический метод обработки результатов

Графический метод заключается в построении графика зависимости между

исследуемыми величинами с последующим определением уравнения зависимости

между ними.

Графики строят прежде всего в равномерных шкалах. Если характер связи

между исследуемыми величинами неизвестен, то сначала проверяют совпадение

экспериментальных точек с заданной кривой. Если предварительные сведения о

характере уравнения отсутствуют, то первым этапом обработки данных является

нахождение кривой, совпадающей с опытными точками. Эта задача решается

методом подбора. Можно использовать эталон ( кальку с предварительно

вычерченным на ней семейством кривых с различными параметрами. Естественно,

что масштаб кальки и эмпирической кривой должен быть одинаков.

Построенный по опытным данным отрезок кривой может совпадать с

большим количеством различных кривых, проходящих достаточно близко к

опытным точкам. В этом случае выбирают кривую с наиболее простым и удобным

в использовании уравнением. Иногда эмпирическая кривая может иметь перегибы

или состоять из отдельных ярко выраженных участков. Однако при этом

необходимо определить координаты точек перехода от одной кривой к другой.

Уравнение зависимости между исследуемыми величинами при графическом

методе просто определяется тогда, когда эмпирические точки достаточно

хорошо совпадают с прямой линией, т.е. описываются уравнением y = ax + b,

где a, b ( коэффициенты, подлежащие определению.

Определение коэффициентов при графическом методе основано на (способе

натянутой нити(. Нанеся результаты эксперимента на график (лучше, если он

выполнен на миллиметровке), подбираем графическую прямую, ближе всего

подходящую к нанесенным точкам. Выбрав положение прямой, определяем две

произвольные точки на этой прямой (не обязательно являющиеся точками

эксперимента), определяем их координаты (x1; y1), (х2; y2). И для

определения коэффициентов а и b получаем два простых уравнения

ах1 + b = y1;

ах2 + b = y2.

На рис. 10 приведена иллюстрация этого метода. Точки ( результаты,

полученные в эксперименте. Прямая проведена на глаз как можно ближе к

экспериментальным точкам. На прямой выбраны точки М (2; 4) и N (13; 10).

Коэффициент а характеризует угол наклона прямой.

Поэтому

Страницы: 1, 2, 3, 4

МЕНЮ

Обработка результатов экспериментов и наблюдений

ИНТЕРЕСНОЕ