Как посчитать доверительный интервал в excel • об этой статье

Распределение стьюдента (t-распределение). расчет критерия стьюдента в excell

Функция ДОВЕРИТ и нормальный доверительный интервал в Excel

Функция ДОВЕРИТ в Excel предназначена для определения доверительного интервала для среднего значения, найденного для генеральной совокупности, которая имеет нормальное распределение.

Другими словами, рассматриваемая функция позволяет определить допустимые отклонения для найденного среднего значения с учетом известных уровня значимости (заданная вероятность того, что некоторое значение находится в доверительном интервале) и стандартного отклонения (меры степени разброса значений относительно среднего значения для генеральной совокупности).

Как построить доверительный интервал нормального распределения в Excel

Поскольку интервал значений, в котором находится некоторая неизвестная величина, совпадает с областью, в которой могут изменяться значения этой величины, то вероятность правильности оценки данной величины стремится к нулю. Поэтому, принято устанавливать определенное значение вероятности для нахождения границ изменения некоторой величины. Значения, находящиеся между этими границами, называют доверительным интервалом.

Рассматриваемая функция была заменена функцией ДОВЕРИТ.НОРМ с версии Excel 2010. Функция ДОВЕРИТ была оставлена для обеспечения совместимости с документами, созданными в более ранних версиях табличного редактора.

Пример расчета доверительного интервала в Excel

Пример 1. В заводском цехе производят деталь, длина которой должна составлять 200 мм. Стандартное отклонение от длины – 3,6 мм. Для контроля качества деталей из партии (генеральная совокупность) делают выборку из 25 деталей. Определить интервал с доверительный уровнем 95%.

Вид таблицы данных:

Для определения доверительного интервала используем функцию:

  • 1-B2 – уровень значимости (рассчитан с учетом зависимости от доверительного уровня);
  • B3 – значение стандартного отклонения;
  • B4 – количество деталей в выборке.

То есть, границы доверительного интервала соответствуют: (Xср-1,4112;Xср+1,4112). Допустим, было определено среднее значение выборки – 199,5 мм. Тогда доверительный интервал примерно определяется как (198,1;200,9), при этом номинальная длина детали (200 мм) находится в доверительном диапазоне, то есть производственный процесс не нарушен.

Как найти границы доверительного интервала в Excel

Пример 2. Были проведены опыты по определению скорости распространения звуковой волны в воздухе. Результаты 10 опытов записаны в таблицу. Определить левую и правую границы доверительного интервала для среднего значения.

Вид таблицы данных:

Для нахождения левой границы используем формулу:

В данном случае выборка и генеральная совокупность приняты как имеющиеся данные для 10 проведенных опытов. Среднее выборочное значение рассчитано с помощью функции СРЗНАЧ. Для получения левой границы доверительного интервала из данного значения вычитаем число, полученное в результате выполнения функции ДОВЕРИТ, в которой значение второго аргумента определено с помощью функции СТАНДОТКЛОН.Г, а число опытов – подсчетом количества ячеек функцией СЧЁТЗ.

Поскольку уровень значимости не задан, используем стандартное значение – 0,05.

Правая граница определяется аналогично с разницей в том, что к среднему значению выборки прибавляется результат расчета функции ДОВЕРИТ:

функция ДОВЕРИЕ — служба поддержки Майкрософт

Excel для Microsoft 365 Excel для Microsoft 365 для Mac Excel для Интернета Excel 2021 Excel 2021 для Mac Excel 2019 Excel 2019 для Mac Excel 2016 Excel 2016 для Mac Excel 2013 Excel 2010 Excel 2007 Excel для Mac 2011 Excel Starter 2010 Дополнительно. .. Меньше

В этой статье описывается синтаксис формулы и использование ДОВЕРИТЕЛЬНОСТИ
функция в Microsoft Excel.

Описание

Возвращает доверительный интервал для среднего значения генеральной совокупности, используя нормальное распределение.

Доверительный интервал представляет собой диапазон значений. Среднее значение вашей выборки, x, находится в центре этого диапазона, а диапазон равен x ± ДОВЕРИТЕЛЬНОСТЬ. Например, если x — выборочное среднее время доставки товаров, заказанных по почте, x ± ДОВЕРИЕ — это диапазон средних значений генеральной совокупности. Для любого среднего значения генеральной совокупности μ0 в этом диапазоне вероятность получения среднего значения выборки дальше от μ0, чем x, больше, чем альфа; для любого среднего значения генеральной совокупности, μ0, не в этом диапазоне, вероятность получения выборочного среднего дальше от μ0, чем x, меньше, чем альфа. Другими словами, предположим, что мы используем x, standard_dev и size для построения двустороннего критерия на уровне значимости альфа гипотезы о том, что среднее значение генеральной совокупности равно µ0. Тогда мы не будем отвергать эту гипотезу, если µ0 находится в доверительном интервале, и отвергнем эту гипотезу, если µ0 не находится в доверительном интервале. Доверительный интервал не позволяет нам сделать вывод о том, что существует вероятность 1 — альфа того, что наша следующая посылка будет доставлена ​​в течение времени, которое находится в доверительном интервале.

Важно: Эта функция была заменена одной или несколькими новыми функциями, которые могут обеспечить повышенную точность и названия которых лучше отражают их использование. Хотя эта функция по-прежнему доступна для обратной совместимости, вам следует рассмотреть возможность использования новых функций с этого момента, так как эта функция может быть недоступна в будущих версиях Excel

Дополнительные сведения о новых функциях см. в разделах Функция ДОВЕРИЕ.НОРМ и Функция ДОВЕРИЕ.T.

Синтаксис

ДОВЕРИЕ(alpha,standard_dev,size)

Синтаксис функции ДОВЕРИЕ имеет следующие аргументы:

  • Standard_dev      Обязательно. Предполагается, что стандартное отклонение генеральной совокупности для диапазона данных и известно.

  • Размер      Обязательно. Размер выборки.

Примечания

  • Если какой-либо аргумент не является числом, функция ДОВЕРИЕ возвращает ошибку #ЗНАЧ! значение ошибки.

  • Если Альфа ≤ 0 или ≥ 1, ДОВЕРИЕ возвращает #ЧИСЛО! значение ошибки.

  • Если Standard_dev ≤ 0, ДОВЕРИТЕЛЬНОСТЬ возвращает #ЧИСЛО! значение ошибки.

  • Если размер не является целым числом, он усекается.

  • Если размер

  • Если мы предположим, что альфа равна 0,05, нам нужно рассчитать площадь под стандартной нормальной кривой, которая равна (1 — альфа), или 95 процентам. Это значение составляет ± 1,96. Следовательно, доверительный интервал:

Пример

Скопируйте данные примера из следующей таблицы и вставьте их в ячейку A1 нового рабочего листа Excel. Чтобы формулы отображали результаты, выберите их, нажмите F2, а затем нажмите клавишу ВВОД. При необходимости вы можете настроить ширину столбцов, чтобы увидеть все данные.

Данные

Описание

0,05

Уровень значимости

2,5

Стандартное отклонение совокупности

50

Объем выборки

Формула

Описание

Результат

=УВЕРЕННОСТЬ(A2,A3,A4)

Доверительный интервал для среднего значения генеральной совокупности. Другими словами, доверительный интервал для среднего значения времени поездки на работу для основного населения составляет 30 ± 0,692952 минуты, или от 29,3 до 30,7 минуты.

0,692951912

Процедура вычисления

Этот метод используется при интервальной оценке различных статистических величин. Главная задача данного расчета – избавится от неопределенностей точечной оценки.

Способ 1: функция ДОВЕРИТ.НОРМ

Оператор ДОВЕРИТ.НОРМ, относящийся к статистической группе функций, впервые появился в Excel 2010. В более ранних версиях этой программы используется его аналог ДОВЕРИТ. Задачей этого оператора является расчет доверительного интервала с нормальным распределением для средней генеральной совокупности.

Его синтаксис выглядит следующим образом:

Все аргументы данного оператора являются обязательными.

Функция ДОВЕРИТ имеет точно такие же аргументы и возможности, что и предыдущая. Её синтаксис таков:

Как видим, различия только в наименовании оператора. Указанная функция в целях совместимости оставлена в Excel 2010 и в более новых версиях в специальной категории «Совместимость». В версиях же Excel 2007 и ранее она присутствует в основной группе статистических операторов.

Граница доверительного интервала определяется при помощи формулы следующего вида:

Где X – это среднее выборочное значение, которое расположено посередине выбранного диапазона.

Теперь давайте рассмотрим, как рассчитать доверительный интервал на конкретном примере. Было проведено 12 испытаний, вследствие которых были получены различные результаты, занесенные в таблицу. Это и есть наша совокупность. Стандартное отклонение равно 8. Нам нужно рассчитать доверительный интервал при уровне доверия 97%.

  1. Выделяем ячейку, куда будет выводиться результат обработки данных. Щелкаем по кнопке «Вставить функцию».

Значит, чтобы посчитать уровень значимости, то есть, определить значение «Альфа» следует применить формулу такого вида:

То есть, подставив значение, получаем:

Путем нехитрых расчетов узнаем, что аргумент «Альфа» равен 0,03. Вводим данное значение в поле.

Как известно, по условию стандартное отклонение равно 8. Поэтому в поле «Стандартное отклонение» просто записываем это число.

В поле «Размер» нужно ввести количество элементов проведенных испытаний. Как мы помним, их 12. Но чтобы автоматизировать формулу и не редактировать её каждый раз при проведении нового испытания, давайте зададим данное значение не обычным числом, а при помощи оператора СЧЁТ. Итак, устанавливаем курсор в поле «Размер», а затем кликаем по треугольнику, который размещен слева от строки формул.

Группа аргументов «Значения» представляет собой ссылку на диапазон, в котором нужно рассчитать количество заполненных числовыми данными ячеек. Всего может насчитываться до 255 подобных аргументов, но в нашем случае понадобится лишь один.

Данный оператор предназначен для расчета среднего арифметического значения выбранного диапазона чисел. Он имеет следующий довольно простой синтаксис:

Аргумент «Число» может быть как отдельным числовым значением, так и ссылкой на ячейки или даже целые диапазоны, которые их содержат.

Способ 2: функция ДОВЕРИТ.СТЮДЕНТ

Кроме того, в Экселе есть ещё одна функция, которая связана с вычислением доверительного интервала – ДОВЕРИТ.СТЮДЕНТ. Она появилась, только начиная с Excel 2010. Данный оператор выполняет вычисление доверительного интервала генеральной совокупности с использованием распределения Стьюдента. Его очень удобно использовать в том случае, когда дисперсия и, соответственно, стандартное отклонение неизвестны. Синтаксис оператора такой:

Как видим, наименования операторов и в этом случае остались неизменными.

Посмотрим, как рассчитать границы доверительного интервала с неизвестным стандартным отклонением на примере всё той же совокупности, что мы рассматривали в предыдущем способе. Уровень доверия, как и в прошлый раз, возьмем 97%.

  1. Выделяем ячейку, в которую будет производиться расчет. Клацаем по кнопке «Вставить функцию».

В поле «Альфа», учитывая, что уровень доверия составляет 97%, записываем число 0,03. Второй раз на принципах расчета данного параметра останавливаться не будем.

Как видим, инструменты программы Excel позволяют существенно облегчить вычисление доверительного интервала и его границ. Для этих целей используются отдельные операторы для выборок, у которых дисперсия известна и неизвестна.

Программа Эксель используется для выполнения различных статистических задач, одной из которых является вычисление доверительного интервала, который применяется как наиболее подходящая замена точечной оценки при малом объеме выборки.

Хотим сразу заметить, что сама процедура вычисления доверительного интервала довольно непростая, однако, в Excel существует ряд инструментов, призванных облегчить выполнение данной задачи. Давайте рассмотрим их.

Калькулятор доверительного интервала

Что такое доверительный интервал?

Простое определение доверительного интервала — это диапазон значений, включающий параметр генеральной совокупности. Значение этого параметра неизвестно. Когда дело доходит до лучшего варианта расчета, лучше всего использовать калькулятор доверительного интервала.

Формула доверительного интервала

Доверительный интервал можно рассчитать по следующей формуле:

\ (\ textbf {Значение нижней границы = Среднее значение (x) — Погрешность} \)

\ (\ textbf {Верхний Связанное значение = среднее значение (x) + предел погрешности} \)

Доверительный интервал зависит от стандартной ошибки и допустимой погрешности.Формула для стандартного отклонения может быть выражена как:

Стандартная ошибка \ (= \ dfrac {\ sigma} {\ sqrt {n}} \)

Формула для погрешности может быть записана как:

Предел погрешности ошибка \ (= \ text {стандартная ошибка} \ times \ text {Z} (0.95) \).

Где Z (0,95) представляет собой z-оценку, равную 95% доверительному уровню. Если вы используете определенный уровень достоверности, вместо этого фактора необходимо определить правильный z-показатель.

Как рассчитать доверительный интервал?

Здесь мы проиллюстрируем метод нахождения доверительного интервала с использованием приведенных выше формул.Выполните следующие шаги, чтобы вычислить доверительный интервал:

  1. Определите и запишите значения
  2. Вычислите стандартную ошибку, используя формулу стандартной ошибки
  3. Вычислите предел погрешности, используя формулу предельной погрешности
  4. Для вычисления верхней и нижней границы доверительного интервала, добавьте и вычтите погрешность из среднего значения.

Пример:

Как найти 95% доверительный интервал?

Давайте разберемся с порядком вычисления доверительного интервала на примере.

Предположим, что имеется выборка из 50 чаш разных размеров. Стандартное отклонение составляет 4 , а средний размер равен 10. Каким будет доверительный интервал?

Решение:

Мы рассчитаем доверительный интервал, используя приведенные выше формулы шаг за шагом. Выполните следующие шаги, чтобы получить доверительный интервал для данных значений:

Определите и запишите значения.

\ (\ sigma = 4, n = 50, \ Mu = 10 \)

Рассчитайте стандартную ошибку, используя уравнение стандартной ошибки.

Стандартная ошибка \ (= \ dfrac {\ sigma} {\ sqrt {n}} = \ dfrac {4} {\ sqrt {50}} = 0,56 \)

Рассчитайте предел погрешности с использованием уравнения погрешности. Предел погрешности будет определяться на основе вычисленного выше стандартного значения ошибки.

Предел погрешности \ (= \ text {Стандартная ошибка} \ times Z (0,95) \)

Здесь член \ (Z (0,95) \) определяет значение Z-оценки при доверительном интервале 95%. ,Обратитесь к этой таблице Z, чтобы получить значение Z. В этом случае \ (Z = 1.758 \).

Предел погрешности \ (= 0,56 \ раз 1,758 = 0,98 \)

Теперь, чтобы вычислить верхнюю и нижнюю границы доверительного интервала, сложите и вычтите предел погрешности из среднее значение.

Среднее значение = 10

Следовательно, диапазон будет записан как:

\ (10 ​​- 0,98 \ leftrightarrow 10 + 0,98 \)

Итак,

Нижняя граница \ (= 9.02 \)

Верхняя граница \ (= 10.98 \)

Как пользоваться нашим калькулятором доверительного интервала?

Чтобы использовать наш калькулятор доверительного интервала:

  • Выберите значение из исходных данных или Среднее и стандартное отклонение.
  • Выберите уровень достоверности из списка. 95 Уровень достоверности будет выбран по умолчанию, если вы не выберете уровень достоверности.
  • Введите среднее значение и значение стандартного отклонения в указанные поля ввода.
  • Введите размер выборки в данное поле ввода.
  • Нажмите кнопку Рассчитать , чтобы увидеть результат.

Калькулятор доверительного интервала мгновенно вычислит доверительный интервал с выбранным уровнем достоверности и покажет вам доверительный интервал, а также допустимую погрешность. Вы можете использовать наш калькулятор стандартного отклонения, чтобы рассчитать стандартное отклонение для доверительного интервала.

Часто задаваемые вопросы

Что означает 95% доверительный интервал?

Уровень достоверности 95% означает, что в 95% случаев результаты будут представлять результаты для всей популяции, если исследование или эксперимент были воспроизведены.Иногда из-за времени или затрат невозможно опросить всех.

Что такое хороший доверительный интервал?

Ваша статистическая точность зависит от изменчивости и размера выборки. Низкая изменчивость или больший размер выборки соответствуют более узкому доверительному интервалу с более низкой погрешностью. Более высокая вариабельность или меньший размер выборки могут привести к большему доверительному интервалу с

Форматы функции CONFIDENCE

Функция CONFIDENCE или ДОВЕРИТ, определяется пределами доверия — это нижняя и верхняя границы ДИ и являются 95% показателями. Например, при изучении предпочтении, было обнаружено, что 70% людей предпочитают Боржоми , по сравнению с Пепси при ДИ в 3% и уровнем доверия 95%, тогда существует 95-процентная вероятность того, что истинная пропорция составляет от 67 до 73%.

Функции “ДОВЕРИТ” отображаются под различными синтаксисами в разных версиях Excel. Например, Excel 2010 имеет две функции: “ДОВЕРИТ.НОРМ” и “ДОВЕРИТ.T”, которые помогают вычислять ширину “ДИ. ДОВЕРИТ.НОРМ” используется, когда известно стандартное отклонение измерения. В противном случае применяется “ДОВЕРИТ.T”, оценка осуществляется по данным выборки. Доверительные интервалы в excel до 2010 года имели только функцию “ДОВЕРИТ”. Его аргументы и результаты были аналогичными аргументам функции “ДОВЕРИТ.НОРМ”.

Первый по-прежнему доступен в более поздних версиях Excel для обеспечения совместимости. #NUM! Error — происходит, если альфа меньше или равна 0, или больше или равна 0. Данное стандартное отклонение меньше или равно 0. Указанный размер аргумента меньше единицы. #СТОИМОСТЬ! Error — происходит, если любой из предоставленных аргументов не является числовым.

Доверительный интервал для математического ожидания нормальной случайной величины при известной дисперсии

Пусть количественный признак  генеральной совокупности имеет нормальное распределение  с заданной дисперсией  и неизвестным математическим ожиданием .  Построим доверительный интервал для .

1) Пусть для оценки  извлечена выборка  объема . Тогда

2) Составим случайную величину:

Нетрудно показать, что случайная величина имеет стандартизированное нормальное распределение, то есть:

3) Зададим уровень значимости .

4) Применяя формулу нахождения вероятности отклонения нормальной величины от математического ожидания, имеем:

Это означает, что доверительный интервал

накрывает неизвестный параметр  с надежностью . Точность оценки определяется величиной:

Число  определяется по таблице значений функции Лапласа из равенства

Окончательно получаем:

ДОВЕРИТ (функция ДОВЕРИТ)

Описание

​Прогноз​ С помощью прогноза​Уровень значимости​

​Стандартное_откл​ что выборочное среднее​α/2​ распределений не равна​Примечание​2​Размер выборки​Размер​ μ0. В этом​В этой статье описаны​Функции прогнозирования​Включить статистические данные прогноза​ сезонность вручную, не​ данные. Тем не​нажмите кнопку​ вы можете предсказывать​2,5​     — обязательный аргумент.​ отличается от μ0​ для различных уровней значимости​ Δ​: Случай, когда дисперсии​. Мы делаем предположение,​Формула​     — обязательный аргумент.​ случае гипотеза не​ синтаксис формулы и​koshareg​Установите этот флажок, если​ используйте значения, которые​ менее при запуске​Лист прогноза​ такие показатели, как​Стандартное отклонение для генеральной​ Стандартное отклонение генеральной​ более чем на​ (10%; 5%; 1%)​0​ распределений известны, кажется​ что эта разница​Описание​ Размер выборки.​ отвергается, если μ0​ использование функции​: Доброго времени суток!​ вы хотите дополнительные​ меньше двух циклов​ прогноз слишком рано,​.​ будущий объем продаж,​ совокупности​ совокупности для диапазона​ x, превышает значение​ используйте формулу =НОРМ.СТ.ОБР(1-α/2).​. А если Хср​ несколько натянутым, т.к.​ равна Δ​Результат​

​Если какой-либо из аргументов​​ принадлежит доверительному интервалу,​ДОВЕРИТ​У меня такая​ статистические сведения о​ статистических данных. При​ созданный прогноз не​В диалоговом окне​ потребность в складских​50​ данных, предполагается известным.​ уровня значимости «альфа».​В файле примера решена​1​ обычно на практике​0​

​=ДОВЕРИТ(A2;A3;A4)​ не является числом,​ и отвергается, если​в Microsoft Excel.​ проблема. нужно построить​

Синтаксис

​ включенных на новый​

​ таких значениях этого​ обязательно прогноз, что​

  • ​Создание листа прогноза​​ запасах или потребительские​Размер выборки​Размер​ Для любого математического​ задача для построения​- Хср​ дисперсии неизвестны, а​, т.е. Δ​Доверительный интервал для математического​ функция ДОВЕРИТ возвращает

  • ​ μ0 ему не​​Возвращает доверительный интервал для​ диаграмму с доверительным​ лист прогноза. В​ параметра приложению Excel​

  • ​ вам будет использовать​​выберите график или​ тенденции.​

Замечания

  • ​Формула​     — обязательный аргумент.​ ожидания μ0, не​ двустороннего доверительного интервала​

  • ​2​ если и известны,​0​ ожидания генеральной совокупности.​

  • ​ значение ошибки #ЗНАЧ!.​ принадлежит. Доверительный интервал​ среднего генеральной совокупности​

  • ​ интервалом.​ результате добавит таблицу​ не удастся определить​

  • ​ статистических данных. Использование​ гистограмму для визуального​Сведения о том, как​Описание​

  • ​ Размер выборки.​ относящегося к этому​ для разницы двух​попадает в границы​ то, скорее всего,​= μ​ Иными словами, доверительный​Если альфа ≤ 0​ не позволяет предполагать,​ с нормальным распределением.​Имеется ввиду, что​

Пример

​ статистики, созданной с​ сезонные компоненты. Если​ всех статистических данных​ представления прогноза.​ вычисляется прогноз и​Результат​Если какой-либо из аргументов​ интервалу, вероятность того,​ средних значений нормальных​ доверительного интервала, то​ известно и среднее,​1 ​ интервал средней продолжительности​

​ или ≥ 1,​

​ что с вероятностью​

​Доверительный интервал представляет собой​

​ есть некоторые данные,​

​ помощью ПРОГНОЗА. ETS.​

​ же сезонные колебания​ дает более точные​

​В поле​

​ какие параметры можно​

​=ДОВЕРИТ.НОРМ(A2;A3;A4)​

​ не является числом,​

​ что выборочное среднее​

​ распределений.​

​ с определенной долей​ которое определить часто​- μ​ поездки на работу​ функция ДОВЕРИТ возвращает​ (1 — альфа)​ диапазон значений. Выборочное​ полученные в ходе​ СТАТИСТИКА функциями, а​ недостаточно велики и​

​ прогноза.​

support.office.com>

Что такое заданная вероятность сигма?

При расчете
доверительного интервала мы можем задать вероятность
попадания
фактических значений в заданные границы прогноза
. Как это сделать? Для этого мы задаем значение сигма и, если сигма будет равна:

3 сигма
— то, вероятность попадания очередного фактического значения в доверительный интервал составят 99,7%, или 300 к 1, или существует 0,3% вероятности выхода за границы.

2 сигма
— то, вероятность попадания очередного значения в границы составляет ≈ 95,5 %, т.е. шансы примерно 20 к 1, или существует 4,5% вероятности выхода за границы.

1 сигма
— то, вероятность ≈ 68,3%, т.е. шансы примерно 2 к 1, или существует 31,7% вероятность того, что очередное значение выйдет за пределы доверительного интервала.

Мы сформулировали правило 3 сигм,
которое гласит, что вероятность попадания
очередного случайного значения в доверительный интервал
с заданным значением три сигма составляет 99.7%
.

Великим русским математиком Чебышевым была доказана теорема о том, что существует 10% вероятность выхода за границы прогноза с заданным значением три сигма. Т.е. вероятность попадания в доверительный интервал 3 сигма составит минимум 90%, в то время как попытка рассчитать прогноз и его границы «на глазок» чревата куда более существенными ошибками.

Пример расчета доверительного интервала в Excel

Пример 1. В заводском цехе производят деталь, длина которой должна составлять 200 мм. Стандартное отклонение от длины – 3,6 мм. Для контроля качества деталей из партии (генеральная совокупность) делают выборку из 25 деталей. Определить интервал с доверительный уровнем 95%.

Вид таблицы данных:

Для определения доверительного интервала используем функцию:

  • 1-B2 – уровень значимости (рассчитан с учетом зависимости от доверительного уровня);
  • B3 – значение стандартного отклонения;
  • B4 – количество деталей в выборке.

То есть, границы доверительного интервала соответствуют: (Xср-1,4112;Xср+1,4112). Допустим, было определено среднее значение выборки – 199,5 мм. Тогда доверительный интервал примерно определяется как (198,1;200,9), при этом номинальная длина детали (200 мм) находится в доверительном диапазоне, то есть производственный процесс не нарушен.

Интервалы и нормальное распределение

Наиболее знакомое использование доверительного интервала, означает «погрешность ошибок». В опросах погрешность составляет плюс или минус 3%. ДИ полезны в контекстах, которые выходят за рамки этой простой ситуации. Они могут использоваться с ненормальными распределениями, которые сильно искажены. Для вычисления прогноза доверительного интервала в excel требуются следующие строительные блоки:

  1. Среднее значение.
  2. Стандартное отклонение наблюдений.
  3. Число опросов в выборке.
  4. Уровень доверия, который нужно применить к ДИ.

Перед тем как построить доверительный интервал в excel, изучают его вокруг среднего значения выборки, начинают с принятия решения о том, какой будет принят процент других средств выборки, если они были собраны и рассчитаны в этом интервале. Если это так , то 95% возможных образцов будут захвачены ДИ с 1,96 стандартных отклонений выше и ниже образца.

Точечная оценка

Как известно из Центральной предельной теоремы , статистика


Х срнесмещенной оценкой среднегогенеральной совокупности

Примечание Что делать, если требуется построить доверительный интервал в случае распределения, которое не является нормальным? В этом случае на помощь приходит Центральная предельная теорема , которая гласит, что при достаточно большом размере выборки n из распределения не являющемся нормальным , выборочное распределение статистики Х ср будет приблизительно соответствовать нормальному распределению с параметрами N(μ;σ 2 /n).

Итак, точечная оценка среднего значения распределения у нас есть – это среднее значение выборки , т.е. Х ср . Теперь займемся доверительным интервалом.

Доверительный интервал для среднего при неизвестной дисперсии

Как и в предыдущем
пункте, оба параметра
исчитаются
неизвестными, при этомявляется
мешающим параметром. По теореме Фишера

и

независимы и имеют
распределения
и-распределение
сстепенью
свободы соответственно. Следовательно,
отношение

имеет распределение
Стьюдента с
степенью
свободы. Выберем функциюравной
правой части (48):

где

выборочная дисперсия, определенная
формулой (30).
Функция
не
зависит явно от мешающего параметра.
Обозначая черезквантиль
распределения Стьюдента сстепенью
свободы, получим, что неравенство

выполнено с
вероятностью
.
Отсюда получаем-доверительный
интервал для:

Так как распределение
Стьюдента симметрично, то по Предложению 3.3

Поэтому доверительный
интервал можно записать в виде

Таким образом,
выборочное среднее
является
серединой этого интервала.

Пример 8.2

Обратимся к
Примеру 6.4.Предположим
, что каждая из выборокивзята
изнормального
распределения снеизвестными
параметрами —исоответственно.
(О том, на основании чего можно сделать
такое допущение, мы поговорим позже в9.5.)

Наша цель — найти
доверительные интервалы для
и,
теоретических значений содержания
углерода и прочности на разрыв стали
GS50. Напомним, что объем каждой из выборок.
Зафиксируем доверительную вероятность,
близкую к единице, скажем.
По таблице распределения Стьюдента на
стр.определим приближенно, что.
Вспоминая значенияи,
найденные в Примере6.5на стр.,
вычисляем

и, пользуясь
формулой (49),
получаем
-доверительный
интервал для процентногосодержания
углерода

и
-доверительный
интервал для значенияпрочности
на разрыв

Построение доверительного интервала

Обычно, зная распределение и его параметры, мы можем вычислить вероятность того, что случайная величина примет значение из заданного нами интервала. Сейчас поступим наоборот: найдем интервал, в который случайная величина попадет с заданной вероятностью. Например, из свойств нормального распределения
известно, что с вероятностью 95%, случайная величина, распределенная по нормальному закону
, попадет в интервал примерно +/- 2 от среднего значения
(см. статью про ). Этот интервал, послужит нам прототипом для доверительного интервала
.

Теперь разберемся,знаем ли мы распределение,
чтобы вычислить этот интервал? Для ответа на вопрос мы должны указать форму распределения и его параметры.

Форму распределения мы знаем – это нормальное распределение
(напомним, что речь идет о выборочном распределении
статистики
Х ср
).

Параметр μ нам неизвестен (его как раз нужно оценить с помощью доверительного интервала
), но у нас есть его оценка Х ср,
вычисленная на основе выборки,
которую можно использовать.

Второй параметр – стандартное отклонение выборочного среднего
будем считать известным
, он равен σ/√n.

Т.к. мы не знаем μ, то будем строить интервал +/- 2 стандартных отклонения
не от среднего значения
, а от известной его оценки Х ср
. Т.е. при расчете доверительного интервала
мы НЕ будем считать, что Х ср
попадет в интервал +/- 2 стандартных отклонения
от μ с вероятностью 95%, а будем считать, что интервал +/- 2 стандартных отклонения
от Х ср
с вероятностью 95% накроет μ – среднее генеральной совокупности,
из которого взята выборка
. Эти два утверждения эквивалентны, но второе утверждение нам позволяет построить доверительный интервал
.

Кроме того, уточним интервал: случайная величина, распределенная по нормальному закону
, с вероятностью 95% попадает в интервал +/- 1,960 стандартных отклонений,
а не+/- 2 стандартных отклонения
. Это можно рассчитать с помощью формулы =НОРМ.СТ.ОБР((1+0,95)/2)
, см. файл примера Лист Интервал
.

Теперь мы можем сформулировать вероятностное утверждение, которое послужит нам для формирования доверительного интервала
: «Вероятность того, что среднее генеральной совокупности
находится от среднего выборки
в пределах 1,960 «стандартных отклонений выборочного среднего»
, равна 95%».

Значение вероятности, упомянутое в утверждении, имеет специальное название , который связан с
уровнем значимости α (альфа) простым выражением уровень доверия
=1
.
В нашем случае уровень значимости
α=1-0,95=0,05
.

Теперь на основе этого вероятностного утверждения запишем выражение для вычисления доверительного интервала
:

где Z α/2

стандартного
нормального распределения
(такое значение случайной величины z
,
что P
(z
>=Z α/2

)=α/2
).

Примечание
: Верхний α/2-квантиль
определяет ширину доверительного интервала
в стандартных отклонениях
выборочного среднего. Верхний α/2-квантиль

стандартного
нормального распределения
всегда больше 0, что очень удобно.

В нашем случае при α=0,05, верхний α/2-квантиль
равен 1,960. Для других уровней значимости α (10%; 1%) верхний α/2-квантиль
Z α/2

можно вычислить с помощью формулы =НОРМ.СТ.ОБР(1-α/2)
или, если известен уровень доверия
, =НОРМ.СТ.ОБР((1+ур.доверия)/2)
.

Обычно при построении доверительных интервалов для оценки среднего
используют только верхний α
/2-квантиль
и не используют нижний α
/2-квантиль
. Это возможно потому, что стандартное
нормальное распределение
симметрично относительно оси х (плотность его распределения
симметрична относительно среднего, т.е. 0
).
Поэтому, нет нужды вычислять нижний α/2-квантиль
(его называют просто α/2-квантиль
), т.к. он равен верхнему α
/2-квантилю
со знаком минус.

Напомним, что, не смотря на форму распределения величины х, соответствующая случайная величина Х ср
распределена приблизительно
нормально
N(μ;σ 2 /n) (см. статью про ). Следовательно, в общем случае, вышеуказанное выражение для доверительного интервала
является лишь приближенным. Если величина х распределена по нормальному закону
N(μ;σ 2 /n), то выражение для доверительного интервала
является точным.

Понравилась статья? Поделиться с друзьями:
Самоучитель Брин Гвелл
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: