8. Статистические оценки параметров генеральной совокупности.
Доверительный интервал и доверительная вероятность
Вспомним первый урок по теме (там же внизу оглавление) и основной метод математической статистики. Он состоит в том, что для изучения генеральной совокупности объёма из неё производится выборка, состоящая из элементов, которая хорошо характеризует всю совокупность (свойство представительности). И на основании исследования этой выборочной совокупности мы с высокой достоверностью можем оценить генеральные характеристики. Чаще всего требуется выявить закон распределения генеральной совокупности (о чём пойдёт речь позже) и оценить его важнейшие числовые параметры, такие как генеральная средняя , генеральная дисперсия и среднее квадратическое отклонение .
Очевидно, что для оценки этих параметров нужно вычислить соответствующие выборочные значения. Так, выборочная средняя позволяет нам оценить генеральную среднюю , причём, оценить её точечно. Почему точечно? Потому что – это отдельно взятое, конкретное значение. Если из той же генеральной совокупности мы будем проводить многократные выборки, то в общем случае у нас будут получаться различные выборочные средние, и каждая из них представляет собой точечную оценку генерального значения .
Аналогично, несмещённой точечной оценкой генеральной дисперсии является исправленная выборочная дисперсия , и соответственно, стандартного отклонения – исправленное стандартное отклонение .
…что-то не понятно / недопонятно в терминах? Срочно изучать предыдущие уроки!
Недостаток точечных оценок состоит в том, что при небольшом объёме выборки (как оно часто бывает), мы можем получать выборочные значения, которые далеки от истины.
И в этих случаях логично потребовать, чтобы выборочная характеристика (средняя, дисперсия или какая-то другая) отличалась от генерального значения не более чем на некоторое положительное значение . А точнее, менее.
Справка: – греческая буква «тета», – греческая буква «дельта».
Значение называется точностью оценки, и озвученное выше требование можно записать с помощью модуля:
Обозначение: точность оценки также обозначают через («эпсилон»).
Но статистические методы не позволяют 100%-но утверждать, что рассчитанное значение будет удовлетворять этому неравенству – ведь в статистике всегда есть место случайности, когда мы можем «выиграть в лотерею» в плохом смысле этого слова. Таким образом, можно говорить лишь о вероятности , с которой это неравенство осуществится: .
А теперь я раскрою модуль:
и сформулирую суть:
Интервал называется доверительным интервалом и представляет собой интервальную оценку генерального значения по найденному выборочному значению . Данный интервал с вероятностью «накрывает» истинное значение . Эта вероятность называется доверительной вероятностью или надёжностью интервальной оценки
Надёжность «гамма» часто задаётся наперёд, популярные варианты
На данном уроке будут рассмотрены:
- доверительный интервал для… – заголовок параграфа в поле зрения; – быстрая ссылка для опытных читателей.
Доверительный интервал для оценки генеральной средней
нормально распределённой генеральной совокупности
И мы сразу разберём распространённую и «заезженную» задачу, которую предлагают даже студентам-гуманитариям:
…да-да, пример уже 21-й!
Известно, что генеральная совокупность распределена нормально со средним квадратическим отклонением . Найти доверительный интервал для оценки математического ожидания с надежностью 0,95, если выборочная средняя , а объем выборки .
Внимание! Важное замечание: если в задаче указан тип выборки (повторная / бесповторная), то решение будет иметь свои особенности – читайте 10-ю статью об оценках по повторной и бесповторной выборке.
А теперь принципиальный момент непосредственно по задаче:
здесь известно стандартное отклонение генеральной совокупности.
Дело в том, что в похожих задачах оно бывает не известно, и тогда решение будет отличаться!
Но сейчас решение таково, разбираемся в ситуации:
– из генеральной совокупности попугаев проведена выборка в особей и по её результатам найдена выборочная средняя: (средняя масса попугая, например).
Выборочная средняя – это точечная оценка неизвестной нам генеральной средней . Как отмечалось выше, недостаток точечной оценки состоит в том, что она может оказаться далёкой от истины. И по условию, требуется найти интервал , которой с вероятностью накроет истинное значение .
Именно так! Здесь будет неверным сказать, что попадёт в этот интервал.
Решаем. Точность оценки рассчитывается по формуле , где – коэффициент доверия. Этот коэффициент отыскивается из соотношения , где – функция Лапласа.
В данном случае , следовательно:
И по таблице значений функции Лапласа либо пользуясь расчётным макетом (пункт 5*), выясняем, что значению соответствует аргумент .
Таким образом, точность оценки:
и искомый доверительный интервал:
Этот интервал с вероятностью (надёжностью) накрывает истинное генеральное значение среднего веса попугая. Но всё же остаётся 5%-ная вероятность, что генеральная средняя окажется вне найденного интервала.
Ответ: .
И тут возникает светлая мысль уменьшить этот интервал – чтобы получить более точную оценку. Что для этого можно сделать? Давайте посмотрим на формулу .
Очевидно, что чем меньше стандартное отклонение (мера разброса значений), тем короче доверительный интервал. Но это в отдельно взятой задаче ни на что не влияет – ведь нам известно конкретное значение , и изменить его нельзя.
Поэтому для уменьшения «дельты» можно уменьшить коэффициент доверия, например, вместо рассмотреть и тогда: , и доверительный интервал действительно станет в 2 раза короче. Но засада в том, что упадёт и доверительная вероятность:
, то есть о том, что этот более узкий интервал накроет генеральную среднюю, мы теперь можем утверждать лишь с вероятностью 68,26%. Что, конечно, неудовлетворительно, для серьёзного статистического исследования.
Поэтому для уменьшения доверительного интервала (при том же значении ) остаётся увеличивать объём выборки . Что совершенно понятно и без формулы , ведь чем больше объём выборки, тем точнее она характеризует генеральную совокупность (при прочих равных условиях). Об объёме мы поговорим на уроке об оценках по повторной и бесповторной выборке, ну а пока продолжаем.
Творческая задача для самостоятельного решения:
По результатам выборочного исследования объектов найдена выборочная средняя .
1) С какой вероятностью можно утверждать, что генеральная средняя отличается от найденного значения менее чем на 3, если известно, что генеральная совокупность распределения нормально с дисперсией 400?
2) Определить доверительный интервал, который с надежностью накроет истинное значение генеральной средней.
Расчётный макет (пункты 5 и 5*) – в помощь. Краткое решение в конце урока.
И тут, наверное, у вас назрели вопросы – а откуда известно, что генеральная совокупность распределена нормально, и тем более, откуда известно её стандартное отклонение?
Обычно эта информация известна из предыдущих исследований. Классический пример – измерительный прибор. Очевидно, что его случайные погрешности удовлетворяют условию теоремы Ляпунова, а значит, распределены нормально. Кроме того, производитель, как правило, тестирует прибор, и указывает в его паспорте стандартное отклонение случайных погрешностей измерений, которое можно принять за .
Но если установить нормальность распределения достаточно просто (в том числе статистическими методами), то с генеральным значением всё сложнее – зачастую вычислить его трудно или невозможно.
В такой ситуации остаётся ориентироваться на исправленное стандартное отклонение , и решение несколько изменится. Ещё одна классическая задача, которая уже встретилась ранее:
В результате 10 независимых измерений некоторой величины , выполненных с одинаковой точностью, полученные опытные данные, которые представлены в таблице:
Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение величины при помощи доверительного интервала, покрывающего это значение с доверительной вероятностью 0,95.
Не путать со случайными ошибками измерительного прибора! Здесь речь идёт об измерениях и помимо технических, велико влияние других, в частности, человеческого фактора, особенно, если вы используете махрово-аналоговый прибор – что-нибудь вроде механического секундомера или линейки.
Решение следует начать с вычисления выборочных характеристик, и задача облегчается тем, что в Примере 13 они уже вычислены: и . По условию, требуется оценить генеральную совокупность (а именно, параметр ), и поэтому дисперсию нужно обязательно поправить:
– несмещённая оценка неизвестной генеральной дисперсии . И нас будет интересовать несмещённая оценка генерального стандартного отклонения :
Теперь построим доверительный интервал для оценки истинного (генерального) значения величины .
Если генеральное стандартное отклонение не известно
(наш случай), то этот интервал строится по похожей формуле:
, с той поправкой, что коэффициент доверия рассчитывается с помощью распределения Стьюдента. В рамках курса теорвера я не рассказывал об этом распределении, и поэтому ограничусь технической стороной вопроса.
Значение можно найти с помощью таблицы значений распределения Стьюдента, в частности, популярна таблица, специально адаптированная для данной задачи*. И, согласно этой таблице, доверительной вероятности и объёму выборки соответствует коэффициент доверия:
* В стандартной же таблице приводятся значения для так называемого уровня значимости и числа степеней свободы .
Другой, более универсальный способ – воспользоваться калькулятором, и чтобы далеко не ходить, я добавил этот функционал в расчётный макет: ищем Пункт 10б, забиваем значения , и получаем «на выходе» .
Вычислим точность оценки:
Таким образом, искомый доверительный интервал:
– данный интервал с вероятностью накрывает истинное значение измеряемой величины .
Ответ:
Для самостоятельного решения:
На основании испытаний установлено, что в среднем для изготовления шавермы полупроводникового диода требуется секунд, а исправленное среднее квадратическое отклонение составляет секунд. Предположив, что время изготовления диода есть нормальная случайная величина, определить с надежностью доверительный интервал для оценки среднего времени изготовления диода
Краткое решение и ответ в конце урока – расчётный макет (Пункт 10б) – в помощь.
Итак, что главное в разобранных задачах? Главное, обратить внимание, генеральное ли нам дано отклонение или исправленное выборочное . От этого зависит, какую формулу нужно использовать, эту:
, где ,
или эту:
, где отыскивается с помощью распределения Стьюдента.
Некоторые коварные авторы (вроде меня) могут предложить и «простое» выборочное отклонение , и тогда его следует поправить по формуле: , которая следует из соотношения дисперсий: . Иногда бывает предложена и дисперсия (та или иная). И поэтому именно здесь нужно проявить аккуратность, сами же вычисления достаточно примитивны.
И ещё один момент: при увеличении объёма выборки , распределение Стьюдента стремится к нормальному распределению, и поэтому уже при (2-й случай) допускается нахождение с помощью того же соотношения . Но я бы не рекомендовал так делать. Потому что если дано , то предполагается, что решать нужно именно через «Стьюдента», и при наличии Экселя с этим никаких проблем – можно рассчитать любые значения, которые отсутствуют в таблицах.
И быстренько более редкая задача:
Доверительный интервал для оценки
генеральной дисперсии и стандартного отклонения
Этот интервал можно построить несколькими способами, которые я постараюсь уместить буквально в пару экранов. И сейчас последует продолжение той же задачи об измерениях:
По равноточным измерениям найдено исправленное среднее квадратическое отклонение . Предполагая, что результаты измерений распределены нормально, построить доверительный интервал для оценки истинного значения (генерального стандартного отклонения) с надёжностью .
Обратите внимание, что для решения этой задачи нам не обязательно знать выборочную среднюю (хотя в Примере 23 мы её нашли).
Способ первый. Доверительный интервал для оценки неизвестной дисперсии нормально распределённой генеральной совокупности определяется следующим образом (не пугаемся):
, где – распределение «хи-квадрат» (ещё один скелет в шкафу:)), а , – его критические значения, вычисленные для ,
Данный интервал с вероятностью (надёжностью) накрывает истинное значение . И если из всех частей неравенства извлечь корни, то получим соответствующий интервал для оценки генерального стандартного отклонения:
Значения известны, и осталось разобраться с нижним этажом. Во-первых, вычислим:
и теперь, по таблице критических значений распределения или с помощью расчётного макета (Пункт 11б) находим:
Обратите внимание, что получены различные значения, и наш доверительный интервал будет асимметричным (ввиду асимметрии распределения «хи-квадрат»):
– не забываем извлечь корни из знаменателей!
– таким образом, с вероятностью можно утверждать, что данный интервал накроет генеральное стандартное отклонение .
Как видите, интервал асимметричен относительно выборочного значения , и его широкий диапазон объясним малым объёмом выборки – велика вероятность, что при 10 измерениях полученное значение «эс» действительно далеко от истинного значения «сигма».
Способ второй. Другой, более простой подход состоит в построении симметричного интервала по формуле:
, где значение отыскивается по соответствующей таблице.
Согласно таблице, доверительной вероятности и объёму соответствует значение , таким образом:
В результате мы получили примерно такой же по размаху интервал. Для малых выборок может даже получиться , в таких случаях принимают ещё более грубую интервальную оценку:
Ответ: 1) , 2) .
Как и для распределения Стьюдента, при увеличении распределение хи-квадрат стремится к нормальному, и уже при можно использовать приближенную формулу:
, где коэффициент доверия определяется из знакомого лапласовского соотношения .
Иногда встречаются обратная задача – по известной точности оценки (т.е. известному интервалу) найти доверительную вероятность . Иногда требуется построить одностороннюю оценку. Но ввиду их исключительного «иногда», я передаю привет студентам Московского института статистики и продолжаю 🙂
Точнее завершаю, и ради исследовательского интереса предлагаю продолжить вам – экзаменационный Пример 20:
В результате обработки экспериментальных данных объёма мы получили следующие выборочные характеристики: .
В предположении о нормальном распределении генеральной совокупности, с надёжностью определить доверительные интервалы:
1) для оценки неизвестной генеральной средней ;
2) для оценки генерального среднего квадратического отклонения двумя способами – с помощью распределения хи-квадрат: и приближённо, по формуле , где .
И заметьте, что здесь «плакал» лёгкий способ построения интервала , так как в стандартной таблице отсутствуют значения для .
Краткое решение и примерный образец оформления в конце урока, который подошёл к концу. В следующей небольшой статье я разберу частную, но весьма популярную задачку по этой же теме – Оценка вероятности биномиального распределения, ну а если вам не терпится, то сразу к послеследующей статье.
До скорых встреч!
Решения и ответы:
Пример 22. Решение:
1) По условию, точность оценки равна и дисперсия .
Из формулы найдём коэффициент доверия:
Вычислим соответствующую доверительную вероятность:
– таким образом, с вероятностью 86,64% можно утверждать, что генеральная средняя отличается от менее чем на (т.е. находится в доверительном интервале от 90 до 96)
2) Для доверительной вероятности :
– этому значению функции Лапласа соответствует аргумент: .
Вычислим точность оценки:
Определим доверительный интервал:
– данный интервал с вероятностью 99% накрывает истинное значение .
Пример 24. Решение: доверительный интервал для оценки истинного значения измеряемой величины имеет вид:
Для заданного уровня доверительной вероятности и количества степеней свободы по таблице распределения Стьюдента находим: .
Вычислим точность оценки:
сек.
Таким образом, искомый доверительный интервал:
– данный интервал с вероятностью 99,9% накрывает истинное значение среднего времени изготовления одного диода.
Пример 26. Решение: вычислим исправленное среднеквадратическое отклонение:
1) Определим доверительный интервал , где .
Для уровня доверительной вероятности и объёма выборки по соответствующей таблице найдём .
Вычислим точность оценки:
Таким образом:
– с вероятностью данный интервал накроет генеральное среднее значение .
2) Найдём доверительный интервал для генерального стандартного отклонения .
а) С помощью распределения :
Вычислим и с помощью соответствующей функции Экселя (Пункт 11б) найдём:
Таким образом:
– искомый интервал, накрывающий генеральное значение с вероятностью .
б) Дадим интервальную оценку приближенно, с помощью формулы:
Коэффициент доверия найдём из соотношения . В данном случае:
, и с помощью таблицы или расчётного макета (Пункт 5*), выясняем, что .
Таким образом:
– искомый интервал.
Ответ:
1) ,
2) с помощью распределения и приближённо.
Автор: Емелин Александр
(Переход на главную страницу)
«Всё сдал!» — онлайн-сервис помощи студентам
Zaochnik.com – профессиональная помощь студентам,
cкидкa 17% на первый зaкaз, при оформлении введите прoмoкoд: 5530-xr4ys
CFA — Доверительные интервалы для среднего значения совокупности
Доверительные интервалы используются для нахождения диапазона значений оцениваемой величины. Рассмотрим эту концепцию, а также концепцию степеней свободы (DF) и t-распределения Стьюдента, — в рамках изучения количественных методов по программе CFA.
Когда нам нужно получить одно число в качестве оценки параметра совокупности, мы используем точечную оценку. Тем не менее, из-за ошибки выборки, точечная оценка не будет в точности равняться параметру совокупности при любом размере данной выборки.
Часто, вместо точечной оценки, более полезным подходом будет найти диапазон значений, в рамках которого, как мы ожидаем, может находится значение искомого параметра с заданным уровнем вероятности.
Этот подход называется интервальной оценкой параметра (англ. ‘interval estimate of parameter’), а доверительный интервал выполняет роль этого диапазона значений.
Определение доверительного интервала.
Доверительный интервал (англ. ‘confidence interval’) представляет собой диапазон, для которого можно утверждать, с заданной вероятностью \(1 — \alpha \), называемой степенью доверия (или степенью уверенности, англ. ‘degree of confidence’), что он будет содержать оцениваемый параметр.
Этот интервал часто упоминается как \(100 (1 — \alpha)\% \) доверительный интервал для параметра.
Конечные значения доверительного интервала называются нижним и верхним доверительными пределами (или доверительными границами или предельной погрешностью, англ. ‘lower/upper confidence limits’).
В этом чтении, мы имеем дело только с двусторонними доверительными интервалами — доверительные интервалами, для которых мы вычисляем и нижние и верхние пределы.
Кроме того, можно определить два типа односторонних доверительных интервалов для параметра совокупности.
Нижний односторонний доверительный интервал устанавливает только нижний предел. Это означает допущение, что с определенной степенью доверия параметр совокупности равен или превышает нижний предел.
Верхний односторонний доверительный интервал устанавливает только верхний предел. Это означает допущение, что с определенной степенью доверия параметр совокупности меньше или равен верхнему пределу.
Инвестиционные аналитики редко используют односторонние доверительные интервалы.
Доверительные интервалы часто дают либо вероятностную интерпретацию, либо практическую интерпретацию.
При вероятностной интерпретации, мы интерпретируем 95%-ный доверительный интервал для среднего значения совокупности следующим образом.
При повторяющейся выборке, 95% таких доверительных интервалов будут, в конечном счете, включать в себя среднее значение совокупности.
Например, предположим, что мы делаем выборку из совокупности 1000 раз, и на основании каждой выборки мы построим 95%-ный доверительный интервал, используя вычисленное выборочное среднее.
Из-за случайного характера выборок, эти доверительные интервалы отличаются друг от друга, но мы ожидаем, что 95% (или 950) этих интервалов включают неизвестное значение среднего по совокупности.
На практике мы обычно не делаем такие повторяющиеся выборки. Поэтому в практической интерпретации, мы утверждаем, что мы 95% уверены в том, что один 95%-ный доверительный интервал содержит среднее по совокупности.
Мы вправе сделать это заявление, потому что мы знаем, что 95% всех возможных доверительных интервалов, построенных аналогичным образом, будут содержать среднее по совокупности.
Доверительные интервалы, которые мы обсудим в этом чтении, имеют структуры, подобные описанной ниже базовой структуре.
Построение доверительных интервалов.
Доверительный интервал \(100 (1 — \alpha)\% \) для параметра имеет следующую структуру.
Точечная оценка \(\pm\) Фактор надежности \(\times\) Стандартная ошибка
- Точечная оценка = точечная оценка параметра (значение выборочной статистики).
- Фактор надежности (англ. ‘reliability factor’) = коэффициент, основанный на предполагаемом распределении точечной оценки и степени доверия \((1 — \alpha)\) для доверительного интервала.
- Стандартная ошибка = стандартная ошибка выборочной статистики, значение которой получено с помощью точечной оценки.
Самый базовый доверительный интервал для среднего значения по совокупности появляется тогда, когда мы делаем выборку из нормального распределения с известной дисперсией. Фактор надежности в данном случае на основан стандартном нормальном распределении, которое имеет среднее значение, равное 0 и дисперсию 1.
Стандартная нормальная случайная величина обычно обозначается как \(Z\). Обозначение \(z_\alpha \) обозначает такую точку стандартного нормального распределения, в которой \(\alpha\) вероятности остается в правом хвосте.
Например, 0.05 или 5% возможных значений стандартной нормальной случайной величины больше, чем \( z_ <0.05>= 1.65 \).
Предположим, что мы хотим построить 95%-ный доверительный интервал для среднего по совокупности, и для этой цели, мы сделали выборку размером 100 из нормально распределенной совокупности с известной дисперсией \(\sigma^2\) = 400 (значит, \(\sigma\) = 20).
Мы рассчитываем выборочное среднее как \( \overline X = 25 \). Наша точечная оценка среднего по совокупности, таким образом, 25.
Если мы перемещаем 1.96 стандартных отклонений выше среднего значения нормального распределения, то 0.025 или 2.5% вероятности остается в правом хвосте. В силу симметрии нормального распределения, если мы перемещаем 1.96 стандартных отклонений ниже среднего, то 0.025 или 2.5% вероятности остается в левом хвосте.
В общей сложности, 0.05 или 5% вероятности лежит в двух хвостах и 0.95 или 95% вероятности лежит между ними.
Таким образом, \( z_ <0.025>= 1.96\) является фактором надежности для этого 95%-ного доверительного интервала. Обратите внимание на связь \(100 (1 — \alpha)\% \) для доверительного интервала и \(z_<\alpha/2>\) для фактора надежности.
Стандартная ошибка среднего значения выборки, заданная Формулой 1, равна:
Доверительный интервал, таким образом, имеет нижний предел:
\( \overline X — 1.96 \sigma_ <\overline X>\) = 25 — 1.96(2) = 25 — 3.92 = 21.08.
Верхний предел доверительного интервала равен:
\( \overline X + 1.96\sigma_ <\overline X>\) = 25 + 1.96(2) = 25 + 3.92 = 28.92
95%-ный доверительный интервал для среднего по совокупности охватывает значения от 21.08 до 28.92.
Доверительные интервалы для среднего по совокупности (нормально распределенная совокупность с известной дисперсией).
Доверительный интервал \(100 (1 — \alpha)\% \) для среднего по совокупности \( \mu \), когда мы делаем выборку из нормального распределения с известной дисперсией \( \sigma^2 \) задается формулой:
\( \Large \dst \overline X \pm z_<\alpha /2> <\sigma \over \sqrt n>\) (Формула 4)
Факторы надежности для наиболее часто используемых доверительных интервалов приведены ниже.
Факторы надежности для доверительных интервалов на основе стандартного нормального распределения.
Мы используем следующие факторы надежности при построении доверительных интервалов на основе стандартного нормального распределения:
- 90%-ные доверительные интервалы: используется \(z_<0.05>\) = 1.65
- 95%-ные доверительные интервалы: используется \(z_<0.025>\) = 1.96
- 99%-ные доверительные интервалы: используется \(z_<0.005>\) = 2.58
На практике, большинство финансовых аналитиков используют значения для \(z_<0.05>\) и \(z_<0.005>\), округленные до двух знаков после запятой.
Для справки, более точными значениями для \(z_<0.05>\) и \(z_<0.005>\) являются 1.645 и 2.575, соответственно.
Для быстрого расчета 95%-ного доверительного интервала \(z_<0.025>\) иногда округляют 1.96 до 2.
Эти факторы надежности подчеркивают важный факт о всех доверительных интервалах. По мере того, как мы повышаем степень доверия, доверительный интервал становится все шире и дает нам менее точную информацию о величине, которую мы хотим оценить.
«Чем уверенней мы хотим быть, тем меньше мы должны быть уверены»
см. Freund и Williams (1977), стр. 266.
На практике, допущение о том, что выборочное распределение выборочного среднего, по меньшей мере, приблизительно нормальное, часто является обоснованным, либо потому, что исходное распределение приблизительно нормальное, либо потому что мы имеем большую выборку и поэтому к ней применима центральная предельная теорема.
Однако, на практике, мы редко знаем дисперсию совокупности. Когда дисперсия генеральной совокупности неизвестна, но выборочное среднее, по меньшей мере, приблизительно нормально распределено, у нас есть два приемлемых пути чтобы вычислить доверительные интервалы для среднего значения совокупности.
Вскоре мы обсудим более консервативный подход, который основан на t-распределении Стьюдента (t-распределение, для краткости).
В финансовой литературе, это наиболее часто используемый подход для статистической оценки и проверки статистических гипотез, касающихся среднего значения, когда дисперсия генеральной совокупности не известна, как для малого, так и для большого размер выборки.
Второй подход к доверительным интервалам для среднего по совокупности, основанного на стандартном нормальном распределении, — это z-альтернатива (англ. ‘z-alternative’). Он может быть использован только тогда, когда размер выборки является большим (в общем случае, размер выборки 30 или больше, можно считать большим).
В отличии от доверительного интервала, приведенного в Формуле 4, этот доверительный интервал использует стандартное отклонение выборки \(s\) при вычислении стандартной ошибки выборочного среднего (по Формуле 2).
Доверительные интервалы для среднего по совокупности — z-альтернатива (большая выборка, дисперсия совокупности неизвестна).
Доверительный интервал \(100 (1 — \alpha)\% \) для среднего по совокупности \( \mu \) при выборке из любого распределения с неизвестной дисперсией, когда размер выборки большой, задается формулой:
\( \Large \dst \overline X \pm z_<\alpha /2> \) (Формула 5)
Поскольку этот тип доверительного интервала применяется довольно часто, мы проиллюстрируем его вычисление в Примере 4.
Пример (4) расчета доверительного интервала для среднего по совокупности коэффициентов Шарпа с использованием z-статистики.
Предположим, что инвестиционный аналитик делает случайную выборку акций взаимных фондов США и рассчитывает средний коэффициент Шарпа.
Размер выборки равен 100, а средний коэффициент Шарпа составляет 0.45. Выборка имеет стандартное отклонение 0.30.
Рассчитайте и интерпретируйте 90-процентный доверительный интервал для среднего по совокупности всех акций взаимных фондов США с использованием фактора надежности на основе стандартного нормального распределения.
Фактор надежности для 90-процентного доверительного интервала, как указано ранее, составляет \( z_ <0.05>= 1.65 \).
Доверительный интервал будет равен:
Доверительный интервал охватывает значения 0.4005 до 0.4995, или от 0.40 до 0.50, с округлением до двух знаков после запятой. Аналитик может сказать с 90-процентной уверенностью, что интервал включает среднее по совокупности.
В этом примере аналитик не делает никаких конкретных предположений о распределении вероятностей, характеризующем совокупность. Скорее всего, аналитик опирается на центральную предельную теорему для получения приближенного нормального распределения для выборочного среднего.
Как показывает Пример 4, даже если мы не уверены в характере распределения совокупности, мы все еще можем построить доверительные интервалы для среднего по совокупности, если размер выборки достаточно большой, поскольку можем применить центральную предельную теорему.
Концепция степеней свободы.
Обратимся теперь к консервативной альтернативе и используем t-распределение Стьюдента, чтобы построить доверительные интервалы для среднего по совокупности, когда дисперсия генеральной совокупности не известна.
Для доверительных интервалов на основе выборок из нормально распределенных совокупностей с неизвестной дисперсией, теоретически правильный фактор надежности основан на t-распределении. Использование фактора надежности, основанного на t-распределении, имеет важное значение для выборок небольшого размера.
Применение фактора надежности \(t\) уместно, когда дисперсия генеральной совокупности неизвестна, даже если у нас есть большая выборка и мы можем использовать центральную предельную теорему для обоснования использования фактора надежности \(z\). В этом случае большой выборки, t-распределение обеспечивает более консервативные (широкие) доверительные интервалы.
t-распределение является симметричным распределением вероятностей и определяется одним параметром, известным как степени свободы (DF, от англ. ‘degrees of freedom’). Каждое значение для числа степеней свободы определяет одно распределение в этом семействе распределений.
Далее мы сравним t-распределения со стандартным нормальным распределением, но сначала мы должны понять концепцию степеней свободы. Мы можем сделать это путем изучения расчета выборочной дисперсии.
Формула 3 дает несмещенную оценку выборочной дисперсии, которую мы используем. Выражение в знаменателе, \( n — 1 \), означающее размер выборки минус 1, это число степеней свободы при расчете дисперсии совокупности с использованием Формулы 3.
Мы также используем \( n — 1 \) как число степеней свободы для определения факторов надежности на основе распределения Стьюдента. Термин «степени свободы» используются, так как мы предполагаем, что в случайной выборке наблюдения отобраны независимо друг от друга. Числитель выборочной дисперсии, однако, использует выборочное среднее.
Каким образом использование выборочного среднего влияет на количество наблюдений, отобранных независимо, для формулы выборочной дисперсии?
При выборке размера 10 и среднем значении в 10%, к примеру, мы можем свободно отобрать только 9 наблюдений. Независимо от отобранных 9 наблюдений, мы всегда можем найти значение для 10-го наблюдения, которое дает среднее значение, равное 10%. С точки зрения формулы выборочной дисперсии, здесь есть 9 степеней свободы.
Учитывая, что мы должны сначала вычислить выборочное среднее от общего числа \(n\) независимых наблюдений, только \(n — 1\) наблюдений могут быть отобраны независимо друг от друга для расчета выборочной дисперсии.
Концепция степеней свободы часто применяется в финансовой статистике, и вы встретите ее в последующих чтениях.
t-распределение Стьюдента.
Предположим, что мы делаем выборку из нормального распределения.
Коэффициент \(z = (\overline X — \mu) \Big / (\sigma \big / \sqrt n) \) нормально распределен со средним значением 0 и стандартным отклонением 1, однако, коэффициент \(t = (\overline X — \mu) \Big / (s \big / \sqrt n) \) следует t-распределению со средним 0 и \(n — 1\) степеней свободы.
Коэффициент \(t\) не является нормальным, поскольку представляет собой отношение двух случайных величин, выборочного среднего и стандартного отклонения выборки.
Определение стандартной нормальной случайной величины включает в себя только одну случайную величину, выборочное среднее. По мере увеличения степеней свободы, однако, t-распределение приближается к стандартному нормальному распределению.
На Рисунке 1 показано стандартное нормальное распределение и два t-распределения, одно с DF = 2 и одно с DF = 8.
Из трех распределений, показанных на Рисунке 1, стандартное нормальное распределение имеет хвосты, которые стремятся к нулю быстрее, чем хвосты двух t-распределений. t-распределение симметрично распределено вокруг среднего нулевого значения, так же как и нормальное распределение.
По мере увеличения степеней свободы, t-распределение приближается к стандартному нормальному распределению. t-распределение с DF = 8 ближе к стандартному нормальному, чем t-распределение с DF = 2.
Помимо области плюс и минус четырех стандартных отклонений от среднего значения, остальная область под стандартным нормальным распределением, как представляется, близка к 0. Однако, оба t-распределения содержать некоторую площадь под каждой кривой за пределом четырех стандартных отклонений.
t-распределения имеют более толстые хвосты, но хвосты t-распределения Стьюдента с DF = 8 сильнее напоминают хвосты нормального распределения. По мере увеличения степеней свободы, хвосты распределения Стьюдента становятся менее толстыми.
Для часто используемых значений распределения Стьюдента составлены таблицы. Например, для каждой степени свободы \(t_<0.10>\), \(t_<0.05>\), \(t_<0.025>\), \(t_<0.01>\) и \(t_<0.005>\) значения будут такими, что соответственно, 0.10, 0.05, 0.025, 0.01 и 0.005 вероятности останется в правом хвосте для заданного числа степеней свободы.
Приведем форму доверительных интервалов для среднего по совокупности, используя распределение Стьюдента.
Доверительные интервалы для среднего по совокупности (дисперсия совокупности неизвестна) — t-распределение.
Если мы делаем выборку из генеральной совокупности с неизвестной дисперсией и соблюдается одно из перечисленных ниже условий:
- выборка является большой, или
- выборка небольшая, но совокупность имеет нормальное распределение, или приблизительно нормально распределена,
то доверительный интервал \(100 (1 — \alpha)\% \) для среднего совокупности \( \mu \) задается формулой:
\( \Large \dst \overline X \pm t_<\alpha /2> \) (Формула 6)
где число степеней свободы для \( t_<\alpha /2>\) равно \( n-1 \), а \( n \) — это размер выборки.
Пример 5 использует данные Примера 4, но применяет t-статистику, а не z-статистику, чтобы рассчитать доверительный интервал для среднего значения совокупности коэффициентов Шарпа.
Пример (5) расчета доверительного интервала для среднего по совокупности коэффициентов Шарпа с использованием t-статистики.
Как и в Примере 4, инвестиционный аналитик стремится вычислить 90-процентный доверительный интервал для среднего по совокупности коэффициентов Шарпа, основанных на случайной выборке из 100 взаимных фондов США.
Выборочное среднее коэффициентов Шарпа составляет 0.45, а выборочное стандартное отклонение — 0.30.
Теперь, признав, что дисперсия генеральной совокупности распределения коэффициентов Шарпа неизвестна, аналитик решает вычислить доверительный интервал, используя теоретически правильную t-статистику.
Поскольку размер выборки равен 100, DF = 99. Используя таблицу степеней свободы, мы находим, что \(t_<0.05>\) = 1.66.
Этот фактор надежности немного больше, чем фактор надежности \(z_<0.05>\) = 1.65, который был использован в Примере 4.
Доверительный интервал будет:
Доверительный интервал охватывает значения 0.4002 до 0.4998, или 0.40 до 0.50, с двумя знаками после запятой. При округлении до двух знаков после запятой, доверительный интервал не изменился по сравнению с Примером 4.
В Таблице 3 приведены различные факторы надежности, которые мы использовали.
Тест по "Теории вероятности и математической статистике"
Вопрос: 1 — й Бросают игральный кубик. Найдите вероятность выпадения грани с 1 или 3 очками:
Вопрос: 2 — й Бросают игральный кубик. Найдите вероятность выпадения грани с 6 очками:
Вопрос: 3 — й Бросают игральный кубик. Найдите вероятность выпадения грани с нечѐтным числом очков:
Вопрос: 4 — й Бросают игральный кубик. Найдите вероятность выпадения грани с чѐтным числом очков:
Вопрос: 5 — й В задачах на расчѐт вероятности того, что в n независимых испытаниях событие A появится от a до b раз, используется при большом числе испытаний и вероятности p, отличной от 0 и 1:
Файлы: 1 файл
Externat_Teoria_veroyatnostey_i_matematicheskaya (9).docx
Ответ: распределение Стьюдента
При проверке гипотезы об однородности ряда вероятностей в случае полиномиального распределения используется:
Ответ: распределение Пирсона
При проверке значимости коэффициента корреляции с помощью таблицы Фишера-Иейтса коэффициент корреляции считается значимым, если:
Ответ: рассчитанное по выборке значение коэффициента корреляции превышает по модулю найденное по таблице критическое значение
Произведение каких событий есть событие невозможное?
Простой называют статистическую гипотезу:
Ответ: однозначно определяющую закон распределения
Симметричный ли интервал строится при оценивании генеральной дисперсии для заданной надѐжности γ?
Симметричный ли интервал строится при оценивании генеральной доли (вероятности) в случае большого объѐма наблюдений для заданной надѐжности γ?
Симметричный ли интервал строится при оценивании генеральной средней для заданной надѐжности γ?
Сколькими способами можно поставить 5 человек в очередь?
Сколькими способов жеребьѐвки существует для 5 участников конкурса?
Сколько различных двухбуквенных бессмысленных слов можно составить из букв К, Н, И, Г, А?
Сколько различных трѐхбуквенных бессмысленных слов можно составить из букв К, Н, И, Г, А?
Сложной называют статистическую гипотезу:
Ответ: не определяющую однозначно закон распределения
Согласно методу наименьших квадратов, в качестве оценок параметров двумерной линейной регрессионной модели следует использовать такие значения b0, b1, которые минимизируют сумму квадратов отклонений:
Ответ: фактических значений зависимой переменной от ее расчетных значений
Статистическим критерием называют:
Ответ: правило, устанавливающее условия, при которых проверяемую гипотезу следует либо отвергнуть, либо не отвергнуть
Статистической гипотезой называют предположение:
Ответ: о виде или параметрах неизвестного закона распределения случайной величины
Сумма каких событий есть событие достоверное?
Точечную оценку называют эффективной, если она:
Ответ: обладает минимальной дисперсией среди всех несмещенных оценок
У какого распределения случайной величины вероятности рассчитываются по формуле Бернулли?
У какого распределения случайной величины вероятности рассчитываются по формуле Пуассона?
Уравнение регрессии имеет вид ŷ=1,7+5,1x. На сколько единиц своего измерения в среднем изменится y при увеличении x на 1 единицу своего измерения:
Ответ: увеличится на 5,1
Уравнение регрессии имеет вид ŷ=1,7-5,1x. На сколько единиц своего измерения в среднем изменится y при увеличении x на 1 единицу своего измерения:
Ответ: уменьшится на 5,1
Уравнение регрессии имеет вид ŷ=5,1+1,7x. На сколько единиц своего измерения в среднем изменится y при увеличении x на 1 единицу своего измерения:
Ответ: увеличится на 1,7
Уравнение регрессии имеет вид ŷ=5,1-1,7x. На сколько единиц своего измерения в среднем изменится y при увеличении x на 1 единицу своего измерения:
Ответ: уменьшится на 1,7
Функция плотности вероятности непрерывной случайной величины есть … еѐ функции распределения
Функция распределения дискретной случайной величины есть функция:
Функция распределения любой случайной величины есть функция:
Функция распределения непрерывной случайной величины есть функция:
Функция распределения непрерывной случайной величины есть … еѐ функции плотности вероятности
Человек забыл последние две цифры номера телефона своего знакомого и, помня лишь, что они различны, пытается набрать номер наугад. Какова вероятность, что он дозвонится с первого раза?
Чем достигается репрезентативность выборки?
Ответ: случайностью отбора
Чему равна вероятность достоверного события?
Чему равна вероятность любого отдельно взятого значения непрерывной случайной величины?
Чему равна вероятность невозможного события?
Чему равна дисперсия постоянной величины?
Чему равна дисперсия случайной величины Y=2X+1, если дисперсия X равна 2?
Чему равна дисперсия случайной величины Y=2X+1, если дисперсия X равна 3?
Чему равна дисперсия случайной величины Y=2X-1, если дисперсия X равна 3?
Чему равна дисперсия случайной величины Y=2X-5, если дисперсия X равна 2?
Чему равна дисперсия случайной величины Y=2X-5, если дисперсия X равна 2?
Чему равна дисперсия случайной величины Y=3X+5, если дисперсия X равна 2?
Чему равна сумма вероятностей всех значений дискретной случайной величины?
Чему равна сумма доверительной вероятности (надѐжности) γ и вероятности α при использовании распределения Стьюдента?
Чему равно математическое ожидание случайной величины Y=2X+2, если математическое ожидание X равно 3?
Чему равно математическое ожидание случайной величины Y=2X-2, если математическое ожидание X равно 4?
Чему равно математическое ожидание случайной величины Y=2X-2, если математическое ожидание X равно 5?
Чему равно математическое ожидание случайной величины Y=4X+2, если математическое ожидание X равно 3?
Чему равно математическое ожидание постоянной величины?
Ответ: этой величине
Чему равно математическое ожидание произведения независимых случайных величин?
Ответ: произведению их математических ожиданий
Чему равно математическое ожидание суммы случайных величин?
Ответ: сумме их математических ожиданий
Что называют мощностью критерия 1-β?
Ответ: Нулевая гипотеза не верна и ее отвергают согласно критерию
Что называют мощностью критерия1-β?
Ответ: вероятность не допустить ошибку второго рода
Что называют ошибкой второго рода β ?
Ответ: Нулевая гипотеза не верна, но ее принимают согласно критерию
Что называют ошибкой первого рода α?
Ответ: Нулевая гипотеза верна, но ее отвергают согласно критерию
Что показывает множественный коэффициент корреляции?
Ответ: тесноту связи между одной величиной и совместным действием остальных величин
Что показывает парный коэффициент корреляции?
Ответ: тесноту связи между величинами X и Y на фоне действия остальных переменных
Что показывает частный коэффициент корреляции?
Ответ: тесноту связи между двумя переменными при фиксированном значении остальных
Что является несмещѐнной точечной оценкой генеральной дисперсии?
Ответ: исправленная выборочная дисперсия
Что является точечной оценкой генеральной дисперсии?
Ответ: выборочная дисперсия
Что является точечной оценкой генеральной доли или вероятности p?
Ответ: частость (относительная частота) события
Что является точечной оценкой математического ожидания?
Ответ: средняя арифметическая
Что является центром при построении доверительного интервала для генеральной доли или вероятности?
Ответ: частость (относительная частота) события
Что является центром при построении доверительного интервала для генеральной средней?
Ответ: средняя арифметическая
Ширина доверительного интервала при построении интервальных оценок зависит от:
Доверительный интервал для оценки среднего (дисперсия известна) в EXCEL
В статье Статистики, выборочное распределение и точечные оценки в MS EXCEL дано определение точечной оценки параметра распределения (point estimator). Однако, в силу случайности выборки, точечная оценка не совпадает с оцениваемым параметром и более разумно было бы указывать интервал, в котором может находиться неизвестный параметр при наблюденной выборке х 1 , x 2 , . х n . Поэтому цель использования доверительных интервалов состоит в том, чтобы по возможности избавиться от неопределенности и сделать как можно более полезный статистический вывод .
Примечание : Процесс обобщения данных выборки , который приводит к вероятностным утверждениям обо всей генеральной совокупности , называют статистическим выводом (statistical inference).
СОВЕТ : Для построения Доверительного интервала нам потребуется знание следующих понятий:
- дисперсия и стандартное отклонение ,
- выборочное распределение статистики ,
- уровень доверия/ уровень значимости ,
- стандартное нормальное распределение и его квантили .
К сожалению, интервал, в котором может находиться неизвестный параметр, совпадает со всей возможной областью изменения этого параметра, поскольку соответствующую выборку , а значит и оценку параметра , можно получить с ненулевой вероятностью. Поэтому приходится ограничиваться нахождением границ изменения неизвестного параметра с некоторой заданной наперед вероятностью.
Определение : Доверительным интервалом называют такой интервал изменения случайной величины , которыйс заданной вероятностью , накроет истинное значение оцениваемого параметра распределения.
Эту заданную вероятность называют уровнем доверия (или доверительной вероятностью ).
Обычно используют значения уровня доверия 90%; 95%; 99%, реже 99,9% и т.д. Например, уровень доверия 95% означает, что дополнительное событие, вероятность которого 1-0,95=5%, исследователь считает маловероятным или невозможным.
Примечание : Вероятность этого дополнительного события называется уровень значимости или ошибка первого рода . Подробнее см. статью Уровень значимости и уровень надежности в MS EXCEL .
Разумеется, выбор уровня доверия полностью зависит от решаемой задачи. Так, степень доверия авиапассажира к надежности самолета, несомненно, должна быть выше степени доверия покупателя к надежности электрической лампочки.
Примечание : Построение доверительного интервала в случае, когда стандартное отклонение неизвестно, приведено в статье Доверительный интервал для оценки среднего (дисперсия неизвестна) в MS EXCEL . О построении других доверительных интервалов см. статью Доверительные интервалы в MS EXCEL .
Формулировка задачи
Предположим, что из генеральной совокупности имеющей нормальное распределение взята выборка размера n. Предполагается, что стандартное отклонение этого распределения известно. Необходимо на основании этой выборки оценить неизвестное среднее значение распределения (μ, математическое ожидание ) и построить соответствующий двухсторонний доверительный интервал .
Точечная оценка
Как известно из Центральной предельной теоремы , статистика (обозначим ее Х ср ) является несмещенной оценкой среднего этой генеральной совокупности и имеет распределение N(μ;σ 2 /n).
Примечание : Что делать, если требуется построить доверительный интервал в случае распределения, которое не является нормальным? В этом случае на помощь приходит Центральная предельная теорема , которая гласит, что при достаточно большом размере выборки n из распределения не являющемся нормальным , выборочное распределение статистики Х ср будет приблизительно соответствовать нормальному распределению с параметрами N(μ;σ 2 /n).
Итак, точечная оценка среднего значения распределения у нас есть – это среднее значение выборки , т.е. Х ср . Теперь займемся доверительным интервалом.
Построение доверительного интервала
Обычно, зная распределение и его параметры, мы можем вычислить вероятность того, что случайная величина примет значение из заданного нами интервала. Сейчас поступим наоборот: найдем интервал, в который случайная величина попадет с заданной вероятностью. Например, из свойств нормального распределения известно, что с вероятностью 95%, случайная величина, распределенная по нормальному закону , попадет в интервал примерно +/- 2 стандартных отклонения от среднего значения (см. статью про нормальное распределение ). Этот интервал, послужит нам прототипом для доверительного интервала .
Теперь разберемся,знаем ли мы распределение , чтобы вычислить этот интервал? Для ответа на вопрос мы должны указать форму распределения и его параметры.
Форму распределения мы знаем – это нормальное распределение (напомним, что речь идет о выборочном распределении статистики Х ср ).
Параметр μ нам неизвестен (его как раз нужно оценить с помощью доверительного интервала ), но у нас есть его оценка Х ср , вычисленная на основе выборки, которую можно использовать.
Второй параметр – стандартное отклонение выборочного среднего будем считать известным , он равен σ/√n.
Т.к. мы не знаем μ, то будем строить интервал +/- 2 стандартных отклонения не от среднего значения , а от известной его оценки Х ср . Т.е. при расчете доверительного интервала мы НЕ будем считать, что Х ср попадет в интервал +/- 2 стандартных отклонения от μ с вероятностью 95%, а будем считать, что интервал +/- 2 стандартных отклонения от Х ср с вероятностью 95% накроет μ – среднее генеральной совокупности, из которого взята выборка . Эти два утверждения эквивалентны, но второе утверждение нам позволяет построить доверительный интервал .
Кроме того, уточним интервал: случайная величина, распределенная по нормальному закону , с вероятностью 95% попадает в интервал +/- 1,960 стандартных отклонений, а не+/- 2 стандартных отклонения . Это можно рассчитать с помощью формулы =НОРМ.СТ.ОБР((1+0,95)/2) , см. файл примера Лист Интервал .
Теперь мы можем сформулировать вероятностное утверждение, которое послужит нам для формирования доверительного интервала : «Вероятность того, что среднее генеральной совокупности находится от среднего выборки в пределах 1,960 « стандартных отклонений выборочного среднего» , равна 95%».
Значение вероятности, упомянутое в утверждении, имеет специальное название уровень доверия , который связан с уровнем значимости α (альфа) простым выражением уровень доверия = 1 -α . В нашем случае уровень значимости α =1-0,95=0,05 .
Теперь на основе этого вероятностного утверждения запишем выражение для вычисления доверительного интервала :
Примечание : Верхний α/2-квантиль определяет ширину доверительного интервала в стандартных отклонениях выборочного среднего. Верхний α/2-квантиль стандартного нормального распределения всегда больше 0, что очень удобно.
В нашем случае при α=0,05, верхний α/2-квантиль равен 1,960. Для других уровней значимости α (10%; 1%) верхний α/2-квантиль Z α/2 можно вычислить с помощью формулы =НОРМ.СТ.ОБР(1-α/2) или, если известен уровень доверия , =НОРМ.СТ.ОБР((1+ур.доверия)/2) .
Обычно при построении доверительных интервалов для оценки среднего используют только верхний α /2- квантиль и не используют нижний α /2- квантиль . Это возможно потому, что стандартное нормальное распределение симметрично относительно оси х ( плотность его распределения симметрична относительно среднего, т.е. 0 ) . Поэтому, нет нужды вычислять нижний α/2-квантиль (его называют просто α /2-квантиль ), т.к. он равен верхнему α /2- квантилю со знаком минус.
Напомним, что, не смотря на форму распределения величины х, соответствующая случайная величина Х ср распределена приблизительно нормально N(μ;σ 2 /n) (см. статью про ЦПТ ). Следовательно, в общем случае, вышеуказанное выражение для доверительного интервала является лишь приближенным. Если величина х распределена по нормальному закону N(μ;σ 2 /n), то выражение для доверительного интервала является точным.
Расчет доверительного интервала в MS EXCEL
Решим задачу. Время отклика электронного компонента на входной сигнал является важной характеристикой устройства. Инженер хочет построить доверительный интервал для среднего времени отклика при уровне доверия 95%. Из предыдущего опыта инженер знает, что стандартное отклонение время отклика составляет 8 мсек. Известно, что для оценки времени отклика инженер сделал 25 измерений, среднее значение составило 78 мсек.
Решение : Инженер хочет знать время отклика электронного устройства, но он понимает, что время отклика является не фиксированной, а случайной величиной, которая имеет свое распределение. Так что, лучшее, на что он может рассчитывать, это определить параметры и форму этого распределения.
К сожалению, из условия задачи форма распределения времени отклика нам не известна (оно не обязательно должно быть нормальным ). Среднее, т.е. математическое ожидание , этого распределения также неизвестно. Известно только его стандартное отклонение σ=8. Поэтому, пока мы не можем посчитать вероятности и построить доверительный интервал .
Однако, не смотря на то, что мы не знаем распределение времени отдельного отклика , мы знаем, что согласно ЦПТ , выборочное распределение среднего времени отклика является приблизительно нормальным (будем считать, что условия ЦПТ выполняются, т.к. размер выборки достаточно велик (n=25)) .
Более того, среднее этого распределения равно среднему значению распределения единичного отклика, т.е. μ. А стандартное отклонение этого распределения (σ/√n) можно вычислить по формуле =8/КОРЕНЬ(25) .
Также известно, что инженером была получена точечная оценка параметра μ равная 78 мсек (Х ср ). Поэтому, теперь мы можем вычислять вероятности, т.к. нам известна форма распределения ( нормальное ) и его параметры (Х ср и σ/√n).
Инженер хочет знать математическое ожидание μ распределения времени отклика. Как было сказано выше, это μ равно математическому ожиданию выборочного распределения среднего времени отклика . Если мы воспользуемся нормальным распределением N(Х ср ; σ/√n), то искомое μ будет находиться в интервале +/-2*σ/√n с вероятностью примерно 95%.
Уровень значимости равен 1-0,95=0,05.
Наконец, найдем левую и правую границу доверительного интервала . Левая граница: =78-НОРМ.СТ.ОБР(1-0,05/2)*8/КОРЕНЬ(25) = 74,864 Правая граница: =78+НОРМ.СТ.ОБР(1-0,05/2)*8/КОРЕНЬ(25)=81,136
Левая граница: =НОРМ.ОБР(0,05/2; 78; 8/КОРЕНЬ(25)) Правая граница: =НОРМ.ОБР(1-0,05/2; 78; 8/КОРЕНЬ(25))
Ответ : доверительный интервал при уровне доверия 95% и σ =8 мсек равен 78+/-3,136 мсек.
В файле примера на листе Сигма известна создана форма для расчета и построения двухстороннего доверительного интервала для произвольных выборок с заданным σ и уровнем значимости .
Функция ДОВЕРИТ.НОРМ()
Если значения выборки находятся в диапазоне B20:B79 , а уровень значимости равен 0,05; то формула MS EXCEL: =СРЗНАЧ(B20:B79)-ДОВЕРИТ.НОРМ(0,05;σ; СЧЁТ(B20:B79)) вернет левую границу доверительного интервала .
Эту же границу можно вычислить с помощью формулы: =СРЗНАЧ(B20:B79)-НОРМ.СТ.ОБР(1-0,05/2)*σ/КОРЕНЬ(СЧЁТ(B20:B79))
Примечание : Функция ДОВЕРИТ.НОРМ() появилась в MS EXCEL 2010. В более ранних версиях MS EXCEL использовалась функция ДОВЕРИТ() .