ДОВЕРИТ (функция ДОВЕРИТ)
Описание
Прогноз С помощью прогнозаУровень значимости
Стандартное_откл что выборочное среднееα/2 распределений не равнаПримечание2Размер выборкиРазмер μ0. В этомВ этой статье описаныФункции прогнозированияВключить статистические данные прогноза сезонность вручную, не данные. Тем ненажмите кнопку вы можете предсказывать2,5 — обязательный аргумент. отличается от μ0 для различных уровней значимости Δ: Случай, когда дисперсии. Мы делаем предположение,Формула — обязательный аргумент. случае гипотеза не синтаксис формулы иkosharegУстановите этот флажок, если используйте значения, которые менее при запускеЛист прогноза такие показатели, какСтандартное отклонение для генеральной Стандартное отклонение генеральной более чем на (10%; 5%; 1%)0 распределений известны, кажется что эта разницаОписание Размер выборки. отвергается, если μ0 использование функции: Доброго времени суток! вы хотите дополнительные меньше двух циклов прогноз слишком рано,. будущий объем продаж, совокупности совокупности для диапазона x, превышает значение используйте формулу =НОРМ.СТ.ОБР(1-α/2).. А если Хср несколько натянутым, т.к. равна ΔРезультат
Если какой-либо из аргументов принадлежит доверительному интервалу,ДОВЕРИТУ меня такая статистические сведения о статистических данных. При созданный прогноз неВ диалоговом окне потребность в складских50 данных, предполагается известным. уровня значимости «альфа».В файле примера решена1 обычно на практике0
=ДОВЕРИТ(A2;A3;A4) не является числом, и отвергается, еслив Microsoft Excel. проблема. нужно построить
Синтаксис
включенных на новый
таких значениях этого обязательно прогноз, что
-
Создание листа прогноза запасах или потребительскиеРазмер выборкиРазмер Для любого математического задача для построения- Хср дисперсии неизвестны, а, т.е. ΔДоверительный интервал для математического функция ДОВЕРИТ возвращает
-
μ0 ему неВозвращает доверительный интервал для диаграмму с доверительным лист прогноза. В параметра приложению Excel
-
вам будет использоватьвыберите график или тенденции.
Замечания
-
Формула — обязательный аргумент. ожидания μ0, не двустороннего доверительного интервала
-
2 если и известны,0 ожидания генеральной совокупности.
-
значение ошибки #ЗНАЧ!. принадлежит. Доверительный интервал среднего генеральной совокупности
-
интервалом. результате добавит таблицу не удастся определить
-
статистических данных. Использование гистограмму для визуальногоСведения о том, какОписание
-
Размер выборки. относящегося к этому для разницы двухпопадает в границы то, скорее всего,= μ Иными словами, доверительныйЕсли альфа ≤ 0 не позволяет предполагать, с нормальным распределением.Имеется ввиду, что
Пример
статистики, созданной с сезонные компоненты. Если всех статистических данных представления прогноза. вычисляется прогноз иРезультатЕсли какой-либо из аргументов интервалу, вероятность того, средних значений нормальных доверительного интервала, то известно и среднее,1 интервал средней продолжительности
или ≥ 1, |
что с вероятностью |
|
Доверительный интервал представляет собой |
есть некоторые данные, |
|
помощью ПРОГНОЗА. ETS. |
же сезонные колебания дает более точные |
|
В поле |
какие параметры можно |
|
=ДОВЕРИТ.НОРМ(A2;A3;A4) |
не является числом, |
что выборочное среднее |
распределений. |
с определенной долей которое определить часто- μ поездки на работу функция ДОВЕРИТ возвращает (1 — альфа) диапазон значений. Выборочное полученные в ходе СТАТИСТИКА функциями, а недостаточно велики и |
прогноза. |
support.office.com>
Статистика и уровни доверия
Доверительный интервал не является числом, в котором истинное значение параметра найдено с точностью. Действительно, случайная величина теоретически может принимать все возможные значения в рамках законов физики. Доверительный интервал — это фактически область, в которой истинное (неизвестное) значение параметра, изучаемого в популяции, наиболее вероятно с вероятностью, которую выбирают. При его использовании интервал основан на вычислении доверительного порога, погрешности и коэффициента запаса.
Перед тем как определить доверительный интервал в excel, определяют эти элементы, которые зависят от параметров:
- Изменчивости измеряемых характеристик.
- Размера выборки: чем она больше, тем более высокая точность.
- Метода отбора проб.
- Уровень доверия – s.
Уровень доверия представляет собой гарантированную уверенность. Например, с уровнем достоверности 90%, это означает, что 10% риск будет неправильным. Как правило, хорошей практикой является выбор достоверности в 95%. Таким образом, максимальный доверительный уровень является большим, чем больше размер выборки. Маржинальный коэффициент является индикатором, выведенным непосредственно из доверительного порога. В таблице приведены некоторые примеры для наиболее распространенных значений.
Функция Excel ДОВЕРИЕ.T
Наблюдения и советы этой статьи мы подготовили на основании опыта команды ДОВЕРИЕ.Т Функция использует распределение Стьюдента для вычисления доверительного интервала для среднего значения генеральной совокупности.
Советы:
Чтобы узнать больше о Студенческая раздача, Вы можете посетите эту страницу в Википедии.
Чтобы узнать больше о Доверительный интервал, Вы можете посетите эту страницу в Википедии.
Примечание: Эта медитация УВЕРЕННОСТЬ.T функция доступен только в Excel 2010 и более поздних версиях.
аргументы
Альфа (обязательно): Уровень значимости, используемый для расчета уровня достоверности, который равен 1 – уровень достоверности. Уровень значимости 0.05 соответствует уровню достоверности 95%.
Standard_dev (обязательно): стандартное отклонение генеральной совокупности для диапазона данных.
Размер (обязательно): размер выборки.
Замечания
1. #NUM! ошибка возникает, если выполняется одно из следующих условий:
— «Альфа» ≤ 0 или ≥ 1;
— «Стандартное_устройство» ≤ 0.
2. # DIV / 0! ошибка возникает, если «размер» = 1;
2. #СТОИМОСТЬ! ошибка возникает, когда какой-либо аргумент не является числовым;
4. Если «размер» не является целым числом, оно будет усечено;
5. Поскольку доверительный интервал представляет собой диапазон значений, чтобы вычислить доверительный интервал для среднего значения генеральной совокупности, доверительное значение, возвращаемое функцией ДОВЕРИЕ.НОРМ, следует добавить к выборочному среднему и вычесть из него.
Доверительный интервал = выборочное среднее ± ДОВЕРИТЕЛЬНОСТЬ
Пример
Предположим, что имеется список значений в диапазоне B6:B16, чтобы вычислить доверительный интервал для среднего значения совокупности с использованием распределения Стьюдента, вам нужно сделать следующее.
Во-первых, вам необходимо указать уровень значимости (обычно 0.05, что соответствует уровню достоверности 95%), стандартное отклонение, размер выборки и среднее значение выборки для диапазона данных.
В ячейке E7 примените следующую формулу для расчета стандартного отклонения генеральной совокупности для диапазона данных.
=STDEV(B6:B16)
В ячейке E8 примените следующую формулу для расчета размера выборки.
=COUNT(B6:B16)
В ячейке E9 примените следующую формулу для расчета среднего значения выборки.
=AVERAGE(B6:B16)
1. Здесь мы вычисляем значение достоверности. Выберите ячейку, например E11, введите приведенную ниже формулу и нажмите кнопку Enter ключ для получения результата.
=CONFIDENCE.T(E6,E7,E8)
Поскольку интервал обычно определяется его нижней и верхней границами. Следующие шаги будут вычислять нижнюю и верхнюю границы доверительного интервала.
2. Выберите ячейку (скажем, E12) для вывода верхней границы, введите приведенную ниже формулу и нажмите кнопку Enter .
=Е9+Е11
2. Выберите ячейку (скажем, E13) для вывода нижней границы, введите приведенную ниже формулу и нажмите кнопку Enter .
=Е9-Е11
Следовательно, доверительный уровень равен от 86.6765346 до 72.4143745.
Связанные функции
Excel функция ХИСКВ.ОБР Функция ХИ.ОБР вычисляет обратную левостороннюю вероятность распределения хи-квадрат.
Функция Excel ХИСКВ.ОБР.ПХ Функция CHISQ.ОБР.ПВ вычисляет обратную правостороннюю вероятность распределения хи-квадрат.
Excel функция ХИСКВ.ТЕСТ Функция CHISQ.TEST вычисляет распределение хи-квадрат двух предоставленных наборов данных (наблюдаемая и ожидаемая частоты).
Функция Excel ДОВЕРИТЕЛЬНОСТЬ.НОРМ Функция ДОВЕРИТЕЛЬНОСТЬ.НОРМ использует нормальное распределение для расчета доверительного интервала для среднего значения генеральной совокупности.
Процедура вычисления
Этот метод используется при интервальной оценке различных статистических величин. Главная задача данного расчета – избавится от неопределенностей точечной оценки.
Способ 1: функция ДОВЕРИТ.НОРМ
Оператор ДОВЕРИТ.НОРМ, относящийся к статистической группе функций, впервые появился в Excel 2010. В более ранних версиях этой программы используется его аналог ДОВЕРИТ. Задачей этого оператора является расчет доверительного интервала с нормальным распределением для средней генеральной совокупности.
Его синтаксис выглядит следующим образом:
Все аргументы данного оператора являются обязательными.
Функция ДОВЕРИТ имеет точно такие же аргументы и возможности, что и предыдущая. Её синтаксис таков:
Как видим, различия только в наименовании оператора. Указанная функция в целях совместимости оставлена в Excel 2010 и в более новых версиях в специальной категории «Совместимость». В версиях же Excel 2007 и ранее она присутствует в основной группе статистических операторов.
Граница доверительного интервала определяется при помощи формулы следующего вида:
Где X – это среднее выборочное значение, которое расположено посередине выбранного диапазона.
Теперь давайте рассмотрим, как рассчитать доверительный интервал на конкретном примере. Было проведено 12 испытаний, вследствие которых были получены различные результаты, занесенные в таблицу. Это и есть наша совокупность. Стандартное отклонение равно 8. Нам нужно рассчитать доверительный интервал при уровне доверия 97%.
- Выделяем ячейку, куда будет выводиться результат обработки данных. Щелкаем по кнопке «Вставить функцию».
Значит, чтобы посчитать уровень значимости, то есть, определить значение «Альфа» следует применить формулу такого вида:
То есть, подставив значение, получаем:
Путем нехитрых расчетов узнаем, что аргумент «Альфа» равен 0,03. Вводим данное значение в поле.
Как известно, по условию стандартное отклонение равно 8. Поэтому в поле «Стандартное отклонение» просто записываем это число.
В поле «Размер» нужно ввести количество элементов проведенных испытаний. Как мы помним, их 12. Но чтобы автоматизировать формулу и не редактировать её каждый раз при проведении нового испытания, давайте зададим данное значение не обычным числом, а при помощи оператора СЧЁТ. Итак, устанавливаем курсор в поле «Размер», а затем кликаем по треугольнику, который размещен слева от строки формул.
Группа аргументов «Значения» представляет собой ссылку на диапазон, в котором нужно рассчитать количество заполненных числовыми данными ячеек. Всего может насчитываться до 255 подобных аргументов, но в нашем случае понадобится лишь один.
Данный оператор предназначен для расчета среднего арифметического значения выбранного диапазона чисел. Он имеет следующий довольно простой синтаксис:
Аргумент «Число» может быть как отдельным числовым значением, так и ссылкой на ячейки или даже целые диапазоны, которые их содержат.
Способ 2: функция ДОВЕРИТ.СТЮДЕНТ
Кроме того, в Экселе есть ещё одна функция, которая связана с вычислением доверительного интервала – ДОВЕРИТ.СТЮДЕНТ. Она появилась, только начиная с Excel 2010. Данный оператор выполняет вычисление доверительного интервала генеральной совокупности с использованием распределения Стьюдента. Его очень удобно использовать в том случае, когда дисперсия и, соответственно, стандартное отклонение неизвестны. Синтаксис оператора такой:
Как видим, наименования операторов и в этом случае остались неизменными.
Посмотрим, как рассчитать границы доверительного интервала с неизвестным стандартным отклонением на примере всё той же совокупности, что мы рассматривали в предыдущем способе. Уровень доверия, как и в прошлый раз, возьмем 97%.
- Выделяем ячейку, в которую будет производиться расчет. Клацаем по кнопке «Вставить функцию».
В поле «Альфа», учитывая, что уровень доверия составляет 97%, записываем число 0,03. Второй раз на принципах расчета данного параметра останавливаться не будем.
Как видим, инструменты программы Excel позволяют существенно облегчить вычисление доверительного интервала и его границ. Для этих целей используются отдельные операторы для выборок, у которых дисперсия известна и неизвестна.
Программа Эксель используется для выполнения различных статистических задач, одной из которых является вычисление доверительного интервала, который применяется как наиболее подходящая замена точечной оценки при малом объеме выборки.
Хотим сразу заметить, что сама процедура вычисления доверительного интервала довольно непростая, однако, в Excel существует ряд инструментов, призванных облегчить выполнение данной задачи. Давайте рассмотрим их.
Как посчитать доверительный интервал по функции ДОВЕРИТ в Excel
Функция имеет следующую синтаксическую запись:
- альфа – обязательный, принимает числовое значение, характеризующее уровень значимости – вероятность отклонения нулевой (неверной) гипотезы в том случае, когда она на самом деле верна. Определяется как 1-, где – уровень доверия (вероятность нахождения истинного значения некоторой оцениваемой величины в определенном интервале, называемом доверительным).
- стандартное_откл – обязательный, принимает значение стандартного отклонения величины для генеральной совокупности значений (в Excel предусмотрена функция для определения этой величины – СТАНДОТКЛОН.Г).
- размер – обязательный, принимает числовое значение, характеризующее количество точек данных в анализируемой выборке (ее размер).
- Все аргументы функции должны указываться в виде числовых значений или данных, которые могут быть преобразованы в числа (например, текстовые строки с числами, логические ИСТИНА, ЛОЖЬ). В противном случае результатом выполнения функции ДОВЕРИТ будет код ошибки #ЧИСЛО!
- Аргумент альфа должен быть указан числовым значением из диапазона от 0 до 1 (оба включительно). Иначе функция ДОВЕРИТ вернет код ошибки #ЧИСЛО! Аналогичная ошибка возникает в случаях, когда аргумент стандартное_откл задан числом, взятым из диапазона отрицательных значений или нулем.
- Диапазон допустимых значений для аргумента размер – от 1 до бесконечности со знаком плюс.
Как самостоятельно рассчитать доверительный интервал в Excel?
Расчет доверительного интервала в Excel (т.е. верхней и нижней границы прогноза) рассмотрим на примере. У нас есть временной ряд — продажи по месяцам за 5 лет. См. Вложенный файл.
Для расчета границ прогноза рассчитаем:
- Прогноз продаж (см. статью «Как самостоятельно рассчитать прогноз продаж с учетом роста и сезонностью»).
- Сигма — среднеквадратическое отклонение модели прогноза от фактических значений.
- Три сигма.
- Доверительный интервал.
1. Прогноз продаж.
О том, «как рассчитать прогноз продаж с учетом роста и с сезонностью» подробно описано в данной статье. Поэтому для тех, кто еще не изучал данный материал и не знает, как самостоятельно рассчитать прогноз продаж по месяцам с учетом роста и сезонности, рекомендуем для понимания последующих действий изучить данную статью, а затем перейти к дальнейшему изучению данного материала.
Для расчета сигма рассчитаем среднеквадратическое отклонение для каждого месяца.
1. Для этого на 7-м шаге во вложенном файле рассчитаем значения прогнозной модели, в нашем случае это прогноз с линейным трендом и сезонностью.
Значение модели = Значение тренда умножим на коэффициент сезонности соответствующего месяца.
В Excel введем формулу:
=RC (ссылка на тренд)*ВПР(RC;R8C9:R19C10;2;0)(формула ВПР со ссылкой на коэффициент сезонности соответствующего месяца)
2. Рассчитаем квадрат разницы фактических значений и прогнозной модели (Xi-Ximod)^2 (8 этап во вложенном файле)
=(RC(данные во временном ряду) — RC(значение модели))^2(в квадрате)
3. Просуммируем для каждого месяца значения отклонений из 8 этапа Сумма((Xi-Ximod)^2), т.е. просуммируем январи, феврали… для каждого года.
Для этого воспользуемся формулой =СУММЕСЛИ()
=СУММЕСЛИ(массив с номерами периодов внутри цикла (для месяцев от 1 до 12);ссылка на номер периода в цикле; ссылка на массив с квадратами разницы исходных данных и значений периодов)
(9 этапво вложенном файле)
4. Рассчитаем среднеквадратическое отклонение для каждого периода в цикле от 1 до 12 (10 этапво вложенном файле).
Для этого из значения рассчитанного на 9 этапе мы извлекаем корень и делим на количество периодов в этом цикле минус 1 = КОРЕНЬ((Сумма(Xi-Ximod)^2/(n-1))
Воспользуемся формулами в Excel =КОРЕНЬ(R8 (ссылка на (Сумма(Xi-Ximod)^2)/(СЧЁТЕСЛИ($O$8:$O$67 (ссылка на массив с номерами цикла); O8 (ссылка на конкретный номер цикла, которые считаем в массиве))-1))
С помощью формулы Excel = СЧЁТЕСЛИ мы считаем количество n
Рассчитав среднеквадратическое отклонение фактических данных от модели прогноза, мы получили значение сигма для каждого месяца — этап 10 во вложенном файле.
На 11 этапе задаем количество сигм — в нашем примере «3» (11 этапво вложенном файле):
Также удобные для практики значения сигма:
1,64 сигма — 10% вероятность выхода за предел (1 шанс из 10);
1,96 сигма — 5% вероятность выхода за пределы (1 шанс из 20);
2,6 сигма — 1% вероятность выхода за пределы (1 шанс из 100).
5) Рассчитываем три сигма, для этого мы значения «сигма» для каждого месяца умножаем на «3».
3.Определяем доверительный интервал.
- Верхняя граница прогноза — прогноз продаж с учетом роста и сезонности + (плюс) 3 сигма;
- Нижняя граница прогноза — прогноз продаж с учетом роста и сезонности – (минус) 3 сигма;
Для удобства расчета доверительного интервала на длительный период (см. вложенный файл) воспользуемся формулой Excel =Y8+ВПР(W8;$U$8:$V$19;2;0), где
Y8 — прогноз продаж;
W8 — номер месяца, для которого будем брать значение 3-х сигма;
$U$8:$V$19 — таблица, из которой с помощью функции =ВПР извлекаем значение 3-х сигма, соответствующее данному месяцу, фиксируем ссылку на таблицу с помощью F4, подробнее в статье «Как зафиксировать ссылку в Excel».
Т.е. Верхняя граница прогноза = «прогноз продаж» + «3 сигма» (в примере, ВПР(номер месяца; таблица со значениями 3-х сигма; столбец, из которого извлекаем значение сигма равное номеру месяца в соответствующей строке;0)).
Нижняя граница прогноза = «прогноз продаж» минус «3 сигма».
Итак, мы рассчитали доверительный интервал в Excel.
Теперь у нас есть прогноз и диапазон с границами в пределах, которого с заданной вероятностью сигма попадут фактические значения.
В данной статье мы рассмотрели, что такое сигма и правило трёх сигм, как определить доверительный интервал и для чего вы можете использовать данную методику на практике.
Медиана и квартили
Квантили нормального распределения
Основная статья: Медиана (статистика)
- 0,25-квантиль называется первым (или нижним) квартилем (от лат. quarta — четверть);
- 0,5-квантиль называется медианой (от лат. mediāna — середина) или вторым квартилем>;
- 0,75-квантиль называется третьим (или верхним) квартилем.
Интерквартильным размахом (англ. Interquartile range) называется разность между третьим и первым квартилями. Интерквартильный размах является характеристикой разброса распределения величины и является робастным аналогом дисперсии. Вместе, медиана и интерквартильный размах могут быть использованы вместо математического ожидания и дисперсии в случае распределений с большими выбросами, либо при невозможности вычисления последних.
Свойство статистики и распределения
Так как статистика по игреку строится таким образом, чтобы она была монотонной и непрерывной по тэте, то можно найти обратную функцию y-1. Для определённости принимают, что игрек по тэта монотонно возрастает. Тогда вероятность расположения будет эквивалентна неравенству: y-1(j/2) < t < y-1(-j/2). Отсюда можно получить доверительный интервал для тэта: P (S -(X | n |, j) < t < S +(X | n |, j)) = 1 — j. Где: S -(X | n |, j) = Y-1(y (a /2)), S +(X | n |, j) = Y-1(y (1- a /2).
Пользуясь общим подходом расчёта доверительных интервалов, можно посчитать вероятность для нормальной генеральной совокупности, опираясь на ряд утверждений. Пусть известна выборка X|n,| взятая из совокупности E ~ N (j, ς2), то есть имеющей нормальный закон распределения с математическим ожиданием j и дисперсией сигма в квадрате. Для такого состояния справедливо следующее:
- Функция вида (X-j) * √ n / ς соответствует стандартному нормальному закону распределения. Икс — это математическое ожидание неизвестного, из которого вычитается истинное значение для получения величины, имеющей нулевую вероятность. После этого величина центруется путём деления на среднее квадратичное отклонение: ς / √ n. Так как закон исходной генеральной совокупности нормальный, то и среднее арифметическое случайных величин будет являться нормально распределённой случайной величиной.
- Если статистика S2 не смещена от точки дисперсии, то функция (X — a) * √n / S будет подчиняться распределению Стьюдента с n — 1 степенью свободы.
- Статистика n — 1, умноженная на несмещённый центр дисперсии и отнесённая к истинному значению, подчиняется распределению хи-квадрат. В числителе формулы находится сумма квадратов нормальных распределений, которые приводятся к нормальным стандартам.
- Когда рассматривается смещённая оценка дисперсии, то статистика nS2 / ς2 соответствует распределению хи-квадрат с эн степенями свободы.
Оценка качества системы A/B-тестирования
- Если , то либо стат. тест, либо выбранная метрика слишком консервативны. То есть у A/B-тестов заниженная чувствительность («стойкий оловянный солдатик»). И это плохо, т. к. в процессе эксплуатации такой системы A/B-тестирования мы будем часто отклонять изменения, которые действительно что-то улучшили, т. к. мы не почувствовали улучшения (т. е. мы будем часто совершать ошибку второго рода).
- Если , то либо стат. тест, либо выбранная метрика слишком чувствительны («принцесса на горошине»). Это тоже плохо, т. к. в процессе эксплуатации мы будем часто принимать изменения, которые в действительности ни на что не влияли (т. е. мы будем часто совершать ошибку первого рода).
- Наконец, если , значит, стат. тест вместе с выбранной метрикой показывают хорошее качество и такой системой можно пользоваться для проведения A/B-тестирования.
(а) Перебираем все возможные пары | (б) Случайно разбиваем на непересекающиеся пары |
Рисунок 4. Два варианта разбиения 4 групп пользователей (, , , ) на пары. |
серьезным недостаткомзависимыхЕсли число пар невелико, то как нам надежно измерить ?
- Повторять раз:
- Случайно распределить всех пользователей по группам;
- Случайно разбить групп на пар;
- Для всех пар провести A/A-тест и вычислить процент прокрасившися пар на данной -ой итерации
-
вычислить как среднее по всем итерациям:
система оценки качества метрик
Дисперсия выборки
Дисперсия выборки (выборочная дисперсия, sample variance) характеризует разброс значений в массиве относительно среднего.
Все 3 формулы математически эквивалентны.
Из первой формулы видно, что дисперсия выборки это сумма квадратов отклонений каждого значения в массиве от среднего, деленная на размер выборки минус 1.
В MS EXCEL 2007 и более ранних версиях для вычисления дисперсии выборки используется функция ДИСП() , англ. название VAR, т.е. VARiance. С версии MS EXCEL 2010 рекомендуется использовать ее аналог ДИСП.В() , англ. название VARS, т.е. Sample VARiance. Кроме того, начиная с версии MS EXCEL 2010 присутствует функция ДИСП.Г(), англ. название VARP, т.е. Population VARiance, которая вычисляет дисперсию для генеральной совокупности. Все отличие сводится к знаменателю: вместо n-1 как у ДИСП.В() , у ДИСП.Г() в знаменателе просто n. До MS EXCEL 2010 для вычисления дисперсии генеральной совокупности использовалась функция ДИСПР() .
Дисперсию выборки можно также вычислить непосредственно по нижеуказанным формулам (см. файл примера ) =КВАДРОТКЛ(Выборка)/(СЧЁТ(Выборка)-1) =(СУММКВ(Выборка)-СЧЁТ(Выборка)*СРЗНАЧ(Выборка)^2)/ (СЧЁТ(Выборка)-1) – обычная формула =СУММ((Выборка -СРЗНАЧ(Выборка))^2)/ (СЧЁТ(Выборка)-1 ) – формула массива
Дисперсия выборки равна 0, только в том случае, если все значения равны между собой и, соответственно, равны среднему значению. Обычно, чем больше величина дисперсии, тем больше разброс значений в массиве.
Дисперсия выборки является точечной оценкой дисперсии распределения случайной величины, из которой была сделана выборка. О построении доверительных интервалов при оценке дисперсии можно прочитать в статье Доверительный интервал для оценки дисперсии в MS EXCEL.
Классификация доверительных интервалов
По виду оцениваемого параметра:
- Доверительный интервал для генерального среднего (математического ожидания);
- Доверительный интервал для дисперсии:
где s 2 — выборочная дисперсия; Χ 2 — квантиль распределения Пирсона. - Доверительный интервал для среднеквадратического отклонения;
- Доверительный интервал для генеральной доли;
По типу выборки:
- Доверительный интервал для бесконечной выборки;
- Доверительный интервал для конечной выборки;
Генеральная совокупность | Бесконечная | Конечная объема N |
Тип отбора | Повторный | Бесповторный |
Средняя ошибка выборки |
Выборка называется повторной, если отобранный объект перед выбором следующего возвращается в генеральную совокупность. Выборка называется бесповторной, если отобранный объект в генеральную совокупность не возвращается. На практике обычно имеют дело с бесповторными выборками.
По виду критической области:
Площадь заштрихованной области равна p -уровню ( p — это вероятность отвергнуть нулевую гипотезу при условии, что она верна). В MS Excel это значение вычисляется:
- двусторонняя область: =2*(1-НОРМСТРАСП(Χнабл))
- левосторонняя область: =НОРМСТРАСП(Χнабл)
- правосторонняя область: =1-НОРМСТРАСП(Χнабл)
Пример расчета доверительного интервала в Excel
Пример 1. В заводском цехе производят деталь, длина которой должна составлять 200 мм. Стандартное отклонение от длины – 3,6 мм. Для контроля качества деталей из партии (генеральная совокупность) делают выборку из 25 деталей. Определить интервал с доверительный уровнем 95%.
Вид таблицы данных:
Для определения доверительного интервала используем функцию:
=ДОВЕРИТ(1-B2;B3;B4)
Описание параметров:
- 1-B2 – уровень значимости (рассчитан с учетом зависимости от доверительного уровня);
- B3 – значение стандартного отклонения;
- B4 – количество деталей в выборке.
Полученный результат:
То есть, границы доверительного интервала соответствуют: (Xср-1,4112;Xср+1,4112). Допустим, было определено среднее значение выборки – 199,5 мм. Тогда доверительный интервал примерно определяется как (198,1;200,9), при этом номинальная длина детали (200 мм) находится в доверительном диапазоне, то есть производственный процесс не нарушен.