реферат, рефераты скачать
 

Математическая статистика


1 Оценка параметров нормального распределения

Нередки случаи, когда у нас есть некоторые основания считать

интересующую нас СВ распределенной по нормальному закону. Существуют

специальные методы проверки такой гипотезы по данным наблюдений, но мы

ограничимся напоминанием природы этого распределения – наличия влияния на

значение данной величины достаточно большого количества случайных факторов.

Напомним себе также, что у нормального распределения всего два

параметра – математическое ожидание ( и среднеквадратичное отклонение (.

Пусть мы произвели 40 наблюдений над такой случайной величиной X и

эти наблюдения представили в виде:

Таблица 5-2

|Xi |85 |105 |125 |145 |165 |185 |205 |225 |Всего|

|ni |4 |3 |3 |2 |4 |7 |12 |5 |40 |

|f i |0.100|0.075|0.075|0.050|0.100|0.175|0.300|0.125|1 |

Если мы усредним значения наблюдений, то формула расчета

выборочного среднего

Mx = [pic]( Xi ( ni =( Xi ( fi

{5–1} будет отличаться от

выражения для математического ожидания ( только использованием частот

вместо вероятностей.

В нашем примере выборочное среднее значение составит Mx = 171.5 , но

из этого пока еще нельзя сделать заключение о равенстве ( = 171.5.

( Во-первых, Mx – это непрерывная СВ, следовательно, вероятность ее

точного равенства чему-нибудь вообще равна нулю.

( Во-вторых, нас настораживает отсутствие ряда значений X.

( В-третьих, частоты наблюдений стремятся к вероятностям при

бесконечно большом числе наблюдений, а у нас их только 40. Не мало ли?

Если мы усредним теперь значения квадратов отклонений наблюдений от

выборочного среднего, то формула расчета выборочной дисперсии

Dx = (Sx)2 = [pic]( (Xi – Mx)2 ( ni =( (Xi)2 ( fi – (Mx)2

{5–2} также не будет отличаться от формулы, определяющей

дисперсию (2 .

В нашем примере выборочное значение среднеквадратичного отклонения

составит Sx= 45.5 , но это совсем не означает, что ( =45.5.

И всё же – как оценить оба параметра распределения или хотя бы один

из них по данным наблюдений, т.е. по уже найденным Mx и Sx?

Прикладная статистика дает следующие рекомендации:

( значение дисперсии (2 считается неизвестным и решается первый

вопрос – достаточно ли число наблюдений N для того, чтобы использовать

вместо величины ( ее выборочное значение Sx;

( если это так, то решается второй вопрос – как построить нулевую

гипотезу о величине математического ожидания ( и как ее проверить.

Предположим вначале, что значение ( каким–то способом найдено. Тогда

формулируется простая нулевая гипотеза Њ0: (=Mx и осуществляется её

проверка с помощью следующего критерия. Вычисляется вспомогательная функция

(Z–критерий)

[pic] ,

{5-3} значение и знак которой зависят от

выбранного нами предполагаемого (.

Доказано, что значение Z является СВ с математическим ожиданием 0 ,

дисперсией 1 и имеет нормальное распределение.

Теперь важно правильно построить альтернативную гипотезу Њ1. Здесь

чаще всего применяется два подхода.

Выбор одного из них зависит от того – большое или малое (по модулю)

значение Z у нас получилось. Иными словами – как далеко от расчетного Mx

мы выбрали гипотетическое (..

( При малых отличиях между Mx и ( разумно строить гипотезы в виде

Њ0: (= Mx;

Њ1: неизвестное нам значение ( лежит в пределах

Mx – [pic](Z 2k ( ( ( Mx + [pic](Z 2k

{5–4}

Критическое (соответствующее уровню значимости в 5%) значение критерия

составляет при этом = 1.96 (двухсторонний критерий). Если оказывается,

что выборочное значение критерия (Z( < 1.96, то гипотеза Њ0: (=Mx

принимается, данные наблюдений не противоречат ей.

Если же это не так, то мы “в утешение” получаем информацию другого

вида – где, на каком интервале находится искомое значение (.

( При больших отличиях (в большую или меньшую сторону) между ( и Mx

гипотезы строятся иначе Њ0: (= Mx; Њ1: неизвестное нам значение ( лежит вне

пределов, указанных в {5–4}.

Теперь критическое (соответствующее уровню значимости в 5%) значение

критерия составляет Z 1k = 1.645 (односторонний критерий). Если

оказывается, что выборочное значение критерия(Z( ( 1.645, то гипотеза Њ0:

( =Mx отвергается, данные наблюдений противоречат ей.

Если же это не так, то мы получаем информацию другого вида – где, на

каком крае интервале находится искомое значение (. Разумеется, для других

(не 5%) значений уровня значимости Z1k и Z 2k являются другими.

Чуть сложнее путь проверки гипотез о математическом ожидании ( в

случаях, когда ( нам неизвестна и приходится довольствоваться выборочным

значением среднеквадратичного отклонения по данным наблюдений.

В этом случае вместо “z –критерия” используется т.н. “t–критерий” или

критерий Стьюдента

[pic] ,

{5–5} в котором используется значение “несмещенной”

оценки для дисперсии (2

(Sx)2 = [pic]( (Xi – Mx)2 ( ni .

{5–6}

Далее используется доказанное в теории положение – случайная величина

t имеет специальное распределение Стьюдента с m=N–1 степенями свободы.

Существуют таблицы для этого распределения по которым можно найти

вероятность ошибки первого рода или, что более удобно, – граничное значение

этой величины при заданных заранее ( и m. Таким образом, если вычисленное

нами значение (t(( t((,m), то Њ0 отвергается, если же это не так – Њ0

принимается. Конечно, при большом количестве наблюдений (N>100…120)

различие между z– и t–критериями несущественно. Значения критерия

Стьюдента для (=0.05 при разных количествах наблюдений составляют:

Таблица 5–3

|m |1 |2 |3 |4 |5 |6 |7 |8 |9 |10 |20 |30 |40 |120|

|t |12.|4.3|3.1|2.7|2.5|2.4|2.3|2.3|2.2|2.2|2.0|2.0|2.0|1.9|

| |7 |0 |8 |8 |7 |5 |6 |1 |6 |3 |9 |4 |2 |8 |

2 Оценка параметров дискретных распределений

В ряде случаев работы с некоторой дискретной СВ нам удается построить

вероятностную схему событий, приводящих к изменению значений данной

величины. Иными словами – закон распределения нам известен, но неизвестны

его параметры. И наша задача – научиться оценивать эти параметры по данным

наблюдений.

Начнем с наиболее простого случая. Пусть у нас есть основания считать,

что случайная величина X может принимать целочисленные значения на

интервале [0…k…n] с вероятностями

P(X=k)=[pic][pic]pk[pic](1– p)n-k,

т.е. распределена по биномиальному закону. Так вот, – единственный

параметр p этого распределения нас как раз и интересует.

Примером подобной задачи является чисто практический вопрос о контроле

качества товара.

Пусть мы решили оценить качество одной игральной кости из партии,

закупленной для казино. Проведя n=200 бросаний мы обнаружили появлений

цифры 6 в X = 25 случаях.

Выдвинем нулевую гипотезу Њ0: кость симметрична, то есть p= 1/6.

Вроде бы по наблюдениям частота выпадения цифры 6, составившая 25/200

не совпадает с гипотетическим значением вероятности 1/6. Но это чисто

умозрительное, дилетантское заключение.

Теория прикладной статистики рекомендует вычислить значение

непрерывной СВ

[pic],

{5–7} т.е. использовать z–критерий (см. {5–3}).

В нашем примере наблюдаемое значение Z составит около –1.58.

Следовательно, при пороговой вероятности в 5% условие (Z(< 1.96

выполняется и у нас нет оснований отбрасывать нулевую гипотезу о симметрии

игральной кости.

Отметим, что z–критерий позволяет решать еще одну важную задачу – о

достаточном числе испытаний.

Пусть нам требуется проверить качество товара – некоторых изделий,

каждое из которых может быть годным или негодным (бракованным). Пусть

допустимый процент брака составляет p=5%. Ясно, что чем больше испытаний мы

проведем, тем надежнее будет наш статистический вывод – браковать партию

товара (например, – 10000 штук) или считать её пригодной.

Если мы провели n=500 проверок и обнаружили X=30 бракованных изделий,

то выдвинув гипотезу Њ0: p=5% , мы найдем выборочное значение критерия по

{5–7}. Оно составит около 1.03, что меньше “контрольного” 1.96 . Значит, у

нас нет оснований браковать всю партию.

Но возникает вопрос – сколько проверок достаточно для принятия решения

с уровнем значимости в 5%? Для этого достаточно учесть допустимый процент

брака (т.е. задать p), указать допустимое расхождение между ним и

наблюдаемым процентом брака в выборке (d= p–X/n) и воспользоваться

выражением

[pic]

{5–8}

Если мы примем d=(0.02, то получим ответ – вполне достаточно 456

проверок, чтобы убедиться в том, что реальный процент брака отличается от

допустимого не более чем на 2%.

Выборочные распределения на шкале Nom

Напомним, что случайная величина X, принимающая одно из n допустимых

значений A, B, C и т.д. имеет номинальную шкалу тогда, когда для любой

пары этих значений применимы только понятия “равно” или “неравно”.

Для подобных СВ не существует понятий математического ожидания, как и

других моментов распределения. Но понятие закона распределения имеет смысл

– это ряд вероятностей PA = P(X=A) для каждого из допустимых значений.

Соответственно, итоги наблюдения над такой СВ дадут нам частоты fA. Если у

нас имеется всего N наблюдений за такой величиной, то иногда имеется

возможность выдвинуть и проверить гипотезы о природе такой случайной

величины, ее законе распределения и параметрах этого закона. Ситуации,

когда это возможно сделать, не так уж и редки – всё зависит от понимания

нами природы, сути случайных событий, от многозначности случайной величины

и, конечно же, от количества наблюдений.

1 Случай двухзначной случайной величины, N50

При достаточно больших выборках можно поступать и иначе. В качестве

правила проверки гипотез используют так называемый критерий "хи–квадрат”

(2 = ([pic].

{6–1}

Эта непрерывная случайная величина была предложена видным статистиком

Р.Фишером для проверки гипотез о соответствии выборочного распределения

некоторому заданному закону. Для этого используются экспериментальные

частости NE и вычисленные в соответствии Њ0 “теоретические” NH .

Разумеется, суммирование ведется по всем допустимым значениям СВ. В нашем

примере у нее всего лишь два значения (изделие годно или бракованное),

поэтому в числителе надо иметь т.н. поправку на непрерывность. Она

корректирует влияние природы распределений: дискретное у наблюдаемой

величины и непрерывное у критерия Фишера.

Изменим условия предыдущего примера – пусть N= 100, число бракованных

изделий составило NE–=12. Нетрудно определить NE+=88, но что касается

"гипотетических" частостей NH– и NH+, то эти величины зависят от того,

как мы сформулируем гипотезы. Если их оставить без изменения, то эти

частости составят NH+ = 90 и NH– = 10. Вычисление выборочного значения

(2–критерия не вызывает проблем, важнее знать – как использовать результат

расчета. В нашем примере расчетное значение критерия составит 0.25. Кроме

конкретного значения критерия надо учесть так называемое число степеней

свободы. В нашем случае это 1, а в общем случае надо уменьшить число

допустимых значений n на единицу. Ну, а далее требуется взять стандартные

статистические таблицы, учесть пороговое значение ошибки первого рода – и

получить ответ. Для примера приведем часть такой таблицы при (=0.05

Таблица 6–1

|Степеней свободы|1 |2 |3 |4 |5 |6 |7 |8 |9 |

|Критическое (2 |3.84 |5.99 |7.82 |9.49 |11.1 |12.6 |14.1 |15.5 |16.9 |

Если наблюдаемое значение (2 меньше критического, гипотеза Њ0 может

быть принята.

В условиях нашего примера расчетное значение критерия (2 составляет

всего лишь 0.25, что меньше критического 3.48 (для одной степени свободы)

и отвергать гипотезу Њ0 (браковать всю партию) нет оснований. Но, если

бы мы наблюдали не 12, а 17 случаев брака, то расчетное значение критерия

составило бы около 4.62 и гипотезу Њ0 пришлось бы отвергнуть.

3 Случай многозначной случайной величины

Существует достаточно обширный класс задач со случайными величинами,

распределенными на номинальной шкале с тремя и более допустимыми

значениями.

В таких задачах обычно используется все тот же критерий (2 с числом

степеней свободы более одной. По сути дела, используют почти ту же формулу

(2 = ([pic],

{6–2} в которой просто не используется поправка на непрерывность.

Так, например, наблюдая численности покупок четырех категорий

некоторого товара, мы могли зафиксировать следующие данные:

Таблица 6–1

|Товары |A |B |C |D |Всего |

|Число покупок |30 |55 |27 |48 |160 |

Выдвинем гипотезы:

Њ0: Все товары одинаково популярны или РА=РB=РC=РD=0.25

Њ1: Популярности товаров значимо различны.

Несложный расчет дает расчетную величину критерия около 14, т.е.

ощутимо больше критического значения 7.8 для 3–х степеней свободы по табл.

6–1. Это дает нам основание отвергнуть гипотезу о равной популярности этих

видов товара.

Выборочные распределения на шкале Ord

Случайные величины с порядковой шкалой измерения – это дискретные,

для всех допустимых значений которых, кроме отношений“=" или "#”, разрешены

отношения “”. Классическим примером порядковых величин являются

оценки знаний, успеваемости, приоритета. Для таких СВ, как и для

номинальных, не имеют смысла понятия моментов распределений.

Продемонстрируем ряд задач, возникающих при оперировании такими

величинами и рассмотрим специальные методы непараметрической статистики в

применении к этим задачам.

Следует различать ситуации, связанные с величинами на порядковой

шкале:

( случайная величина имеет всего два допустимых значения (одно из них

больше, предпочтительнее второго);

( случайная величина имеет более двух допустимых значений.

В первом случае мы имеем по сути дела двух позиционную номинальную

шкалу и все сказанное выше о распределениях на шкале Nom вполне приемлемо

для решения задач на такой шкале Rel. К примеру – задачи о проверке

симметрии монеты или о допустимом количестве бракованных изделий вполне

могут рассматриваться с использование порядковой шкалы, если считать герб

“старше” решки, бракованное изделие “хуже” исправного.

Второй тип СВ предполагает наличие нескольких фиксированных значений,

упорядоченных по некоторому признаку, свойству или нашему предпочтению. В

этих случаях говорят, что случайная величина (например – оценка знаний,

сорт товара) может быть величиной “первого ранга”, “второго ранга” и т.д.

В принципе корректная постановка задач о распределении СВ на

порядковых (ранговых) шкалах ничем не отличается от рассмотренных ранее

методов статистики для интервальных, относительных и номинальных шкал.

Пусть мы наблюдали, зафиксировали оценки знаний 100 обучаемых по

четырех ранговой шкале (“отлично”, “хорошо”, “удовлетворительно” и

“плохо”)

Таблица 7–1

|Оценка знаний |Отл. |Хор. |Удовл.|Плохо |Всего |

|Ранг оценки по смыслу |1 |2 |3 |4 | |

|Количество наблюдений |25 |45 |20 |10 |100 |

|Ранг по итогам наблюдений|2 |1 |3 |4 | |

Как обычно, далее приходится строить гипотезы и подбирать критерии для

их проверки. При выдвижении нулевой гипотезы надо, прежде всего, помнить о

необходимости с её помощью рассчитать распределение СВ – в нашем случае это

означает расчет количества оценок в условиях истинности Њ0.

Конечно, без “технологических” представлений о природе СВ выдвижение и

проверка гипотез (а затем использование статистических выводов) – пустая

трата времени.

Пусть мы осознаем зависимость оценки знаний от предварительной

подготовки обучаемых (она может быть одинакова у всех или значимо

отличаться), от эффективности системы обучения и, наконец, от способа

проверки знаний. Тогда результаты наблюдений могут оказаться полезными при

решении задач управления обучением и, по крайней мере, контроля процесса

обучения.

Если у нас есть основания считать предварительную подготовку обучаемых

одинакового уровня для всех и способ проверки знаний достаточно

объективным, то тогда можно выдвинуть нулевую гипотезу Њ0: система

обучения эффективна. Конечно, мы не можем теоретически предсказать

количество оценок каждого из рангов. Но этого и не нужно – оценки не числа,

и частота наблюдения оценки “отлично” не может быть умножена на значение

этой оценки. Другое дело, если мы договоримся считать систему обучения

эффективной только в том случае, если она по отношению к одинаково

подготовленным обучаемым дает большие числа более высоких оценок.

Тогда, в соответствии с Њ0 ранги 2–й строки табл.7–1 могут

рассматриваться как гипотетические, а ранги 4-й строки – как выборочные,

наблюдаемые. Осталось установить – какой же критерий принять для проверки

нашей гипотезы. Один из часто используемых в подобных задачах критериев

носит название коэффициента ранговой корреляции Спирмэна

[pic] ,

{7–1}

в котором di – разности гипотетических и наблюдаемых рангов; n – число

рангов.

Величина коэффициента ранговой корреляции имеет непрерывное

распределение на интервале [–1…+1] с математическим ожиданием 0 – если,

конечно, гипотеза Њ0 верна. Поэтому значение вычисленного Rs можно

использовать в качестве критерия проверки гипотез. В нашем примере сумма

квадратов разностей рангов равна S=2 и для n=4 коэффициент Спирмэна по

итогам наблюдений составит Rs = 0.8. Обратимся теперь к статистическим

таблицам и рассмотрим ту, которая рассчитана для числа рангов n=4.

Таблица 7–2

|Наблюдаемое значение суммы S |2 |4 |6 |8 |10 |

|Вероятность S при ошибочности Њ0 |0.042 |0.167 |0.208 |0.375 |0.458 |

Для нашего примера предположение о полной эффективности системы

обучения вполне обосновано.

Мы ознакомились только с одним из существующих методов статистического

анализа СВ со шкалой Ord. Существуют и другие, обоснованные и

апробированные методы (коэффициент ранговой корреляции Кэндалла). Отличие

между ними только в способе расчета критерия принятия или отбрасывания

нулевой гипотезы.Вместе с тем мы не затронули вопроса о проблемах,

возникающих при наличии нескольких величин с ранговой шкалой измерения.

Эти проблемы связаны с множественной ранговой корреляцией или конкордацией

(согласованностью рангов).

Пусть у нас имеются ранжировки m=4 экспертов по отношению к n=6

факторам, которые определяют эффективность некоторой экономической системы:

|Эксперты / Факторы |F1 |F2 |F3 |F4 |F5 |F6 |( |

|A |5 |4 |1 |6 |3 |2 |21 |

|B |2 |3 |1 |5 |6 |4 |21 |

|C |4 |1 |6 |3 |2 |5 |21 |

|D |4 |3 |2 |5 |1 |6 |21 |

|Сумма рангов |15 |11 |10 |19 |12 |17 |84 |

|Суммарный ранг |4 |2 |1 |6 |3 |5 | |

|Отклонение суммы рангов от 84/6 |+1 |-3 |-4 |+5 |-2 |+3 | |

|=14 | | | | | | | |

|Квадраты этих отклонений |1 |9 |16 |25 |4 |9 |64 |

Заметим, что полная сумма рангов составляет 84, что дает в среднем по

14 на фактор. Для общего случая n факторов и m экспертов среднее

значение суммы рангов для любого фактора определится выражением

Страницы: 1, 2, 3


ИНТЕРЕСНОЕ



© 2009 Все права защищены.