Как рассчитать доверительный интервал с помощью функции excel?

Дисперсионный анализ: соединение теории и практики

СТАНДОТКЛОНА (функция СТАНДОТКЛОНА)

​ были рассчитаны стандартное​«Число»​ координаты были занесены​​ отдельная функция –​​ до 255 полей,​

Описание

​ любую свободную ячейку​ отдельно функции для​ (50% / 33%).​Прежде чем включить в​ доходность актива близка​ доходность и различный​

Синтаксис

​ который содержит по​

​ ссылку на массив.​ нажмите клавишу F2,​

​ ЛОЖЬ, в ссылке.​​ выборке. Стандартное отклонение​ коэффициента вариации менее​ отклонение и среднее​. Из раскрывшегося списка​ в поле окна​СРЗНАЧ​ в которых могут​ на листе, которая​ вычисления этого показателя,​ Это означает, что​

Замечания

​ инвестиционный портфель дополнительный​ к 0, коэффициент​ уровень риска. К​ крайней мере один​И ещё одна​ а затем —​Аргументы, содержащие значение ИСТИНА,​ — это мера​ 33%, то совокупность​

​ арифметическое. Но можно​ вариантов выбираем​

​ аргументов, жмем на​. Вычислим её значение​ содержаться, как конкретные​ удобна вам для​ но имеются формулы​ акции компании А​ актив, финансовый аналитик​

​ вариации может получиться​ примеру, у одного​ заголовок столбца и​ функция.​ клавишу ВВОД. При​ интерпретируются как 1.​

​ того, насколько широко​ чисел однородная. В​ поступить и несколько​«Процентный»​ кнопку​ на конкретном примере.​ числа, так и​

​ того, чтобы выводить​ для расчета стандартного​ имеют лучшее соотношение​ должен обосновать свое​

​ большим. Причем показатель​ актива высокая ожидаемая​ по крайней мере​ДСТАНДОТКЛ (база_данных; поле;​ необходимости измените ширину​ Аргументы, содержащие текст​

​ разбросаны точки данных​ обратном случае её​

​ по-иному, не рассчитывая​. После этих действий​«OK»​

Пример

​Выделяем на листе ячейку​ ссылки на ячейки​ в неё результаты​ отклонения и среднего​ риск / доходность.​ решение. Один из​ значительно меняется при​ доходность, а у​ одну ячейку под​ критерий)​ столбцов, чтобы видеть​ или значение ЛОЖЬ,​ относительно их среднего.​

​ принято характеризовать, как​

​ отдельно данные значения.​

​ формат у элемента​

​ для вывода результата.​

​ или диапазоны. Ставим​

​ расчетов. Щелкаем по​

​ арифметического ряда чисел,​

​ Следовательно, предпочтительнее вложить​

​ незначительном изменении доходности.​

​ заголовком столбца с​

​База данных. Интервал​

​ интерпретируются как 0​

​СТАНДОТКЛОНА(значение1;;…)​ неоднородную.​Выделяем предварительно отформатированную под​

Расчет доверительного интервала для математического ожидания с помощью t-распределения Стьюдента в Excel

С проверкой гипотез тесно связан еще один статистический метод – расчет доверительных интервалов. Если в полученный интервал попадает значение, соответствующее нулевой гипотезе, то это равносильно тому, что нулевая гипотеза не отклоняется. В противном случае, гипотеза отклоняется с соответствующей доверительной вероятностью. В некоторых случаях аналитики вообще не проверяют гипотез в классическом виде, а рассчитывают только доверительные интервалы. Такой подход позволяет извлечь еще больше полезной информации.

Рассчитаем доверительные интервалы для средней при 9 и 25 наблюдениях. Для этого воспользуемся функцией Excel ДОВЕРИТ.СТЬЮДЕНТ. Здесь, как ни странно, все довольно просто. В аргументах функции нужно указать только уровень значимости α, стандартное отклонение по выборке и размер выборки. На выходе получим полуширину доверительного интервала, то есть значение которое нужно отложить по обе стороны от средней. Проведя расчеты и нарисовав наглядную диаграмму, получим следующее.

Как видно, при выборке в 9 наблюдений значение 50 попадает в доверительный интервал (гипотеза не отклоняется), а при 25-ти наблюдениях не попадает (гипотеза отклоняется). При этом в эксперименте с 25-ю мешками можно утверждать, что с вероятностью 97,5% генеральная средняя превышает 50,1 кг (нижняя граница доверительного интервала равна 50,094кг). А это довольно ценная информация.

Таким образом, мы решили одну и ту же задачу тремя способами:

1. Древним подходом, сравнивая расчетное и табличное значение t-критерия2. Более современным, рассчитав p-value, добавив степень уверенности при отклонении гипотезы.3. Еще более информативным, рассчитав доверительный интервал и получив минимальное значение генеральной средней.

Важно помнить, что t-критерий относится к параметрическим методам, т.к. основан на нормальном распределении (у него два параметра: среднее и дисперсия)

Поэтому для его успешного применения важна хотя бы приблизительная нормальность исходных данных и отсутствие выбросов.

Напоследок предлагаю видеоролик о том, как рассчитать критерий Стьюдента и проверить гипотезу о генеральной средней в Excel.

Иногда просят объяснить, как делаются такие наглядные диаграммы с распределением. Ниже можно скачать файл, где проводились расчеты для этой статьи.

Всего доброго, будьте здоровы.

Определение границ интервала с двух сторон

Для расчета границ интервала необходимо узнать, каково среднее значение по нему, с помощью функции СРЗНАЧ.

  1. Откроем «Менеджер функций» и выберем нужный оператор в разделе «Статистические».

14

  1. Добавляем группу ячеек, содержащих значения, в поле первого аргумента и жмем кнопку «ОК».

15

  1. Теперь можно определить правую и левую границу. Понадобятся простые математические действия. Расчет правой границы: выбираем пустую ячейку, проводим в ней сложение ячеек с доверительным интервалом и средним значением.

16

  1. Для определения левой границы из среднего значения нужно вычесть доверительный интервал.

17

  1. Такие же операции проделываем с доверительным интервалом по Стьюденту. В результате получаем границы интервала в двух вариантах.

18

Функция интерполяции доверия

«ДОВЕРИТ.» классифицируется по функциям статистики и будет высчитывать и возвращать ДИ для среднего значения. Доверительные интервалы в excel могут быть очень полезными для денежного анализа. Как аналитик, «ДОВЕРИТ.» помогает в прогнозировании и корректировке для широкого круга целей, методом оптимизации принятия денежных решений. Это производится с применением графического отображения данных в наборе переменных.

Аналитики могут принимать наиболее действенные решения на базе статистической инфы, предоставляемой обычным распределением. К примеру, они могут отыскать связь меж приобретенным доходом и расходами, затрачиваемыми на предметы роскоши. Чтоб вычислить ДИ для среднего значения совокупы, возвращаемое доверительное значение, обязано быть добавлено и вычтено из среднего значения подборки. К примеру, для среднего значения подборки x: Доверительный интервал = x ± ДОВЕРИТ.

Пример расчета доверительного интервала в excel — представим, что нам даны последующие данные:

Функция доверительного интервала Excel употребляется для расчета ДИ со значением 0,05 (т. е. уровень достоверности 95%) для среднего времени подборки для исследования времени коммутации в кабинете на 100 человек. Среднее значение эталона составляет 30 минут, а обычное отклонение составляет 2,5 минутки. Доверительный интервал составляет 30 ± 0,48999, что соответствует спектру 29,510009 и 30,48999 (минут).

Доверительные интервалы для зависимой переменной

Уравнение тренда имеет вид y = at 2 + bt + c 1. Находим параметры уравнения методом наименьших квадратов. Система уравнений

Для наших данных система уравнений имеет вид (см. таблицу).

Получаем a = -11.37, a1 = 88.47, a2 = 2151.09 Уравнение тренда: y = -11.37t 2 +88.47t+2151.09 Оценим качество уравнения тренда с помощью ошибки абсолютной аппроксимации.

Поскольку ошибка больше 15%, то данное уравнение не желательно использовать в качестве тренда Средние значения

т.е. в 87.35 % случаев влияет на изменение данных. Другими словами — точность подбора уравнения тренда — высокая

t y t 2 y 2 x ∙ y y(t) (y-y cp ) 2 (y-y(t)) 2 (t-t p ) 2 (y-y(t)) : y t 3 t 4 t 2 y
1 2225.3 1 4951960.09 2225.3 2228.19 65.6099 8.352 16 6431.117 1 1 2225.3
2 2254.9 4 5084574.01 4509.8 2282.55 462.25 764.5225 9 62347.985 8 16 9019.6
3 2332.3 9 5439623.29 6996.9 2314.17 9781.21 328.6969 4 42284.599 27 81 20990.7
4 2365.8 16 5597009.64 9463.2 2323.05 17529.76 1827.5625 1 101137.95 64 256 37852.8
5 2295.4 25 5268861.16 11477 2309.19 3844 190.1641 31653.566 125 625 57385
6 2303.9 36 5307955.21 13823.4 2272.59 4970.25 980.3161 1 72135.109 216 1296 82940.4
7 2166.7 49 4694588.89 15166.9 2213.25 4448.89 2166.9025 4 100859.885 343 2401 106168.3
8 2080.4 64 4328064.16 16643.2 2131.17 23409 2577.5929 9 105621.908 512 4096 133145.6
9 2075.9 81 4309360.81 18683.1 2026.35 24806.25 2455.2025 16 102860.845 729 6561 168147.9
45 20100.6 285 44981997.26 98988.8 20100.51 89317.2199 11299.312 60 625332.964 4050 30666 1235751.2

2. Анализ точности определения оценок параметров уравнения тренда.

Анализ точности определения оценок параметров уравнения тренда

S a = 4.8518 Доверительные интервалы для зависимой переменной

По таблице Стьюдента находим Tтабл Tтабл (n-m-1;a) = (7;0.05) = 1.895 Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и t = 6 2151.09 + 88.47*6 + -11.37*62 — 1.895*39.911 ; 2151.09 + 88.47*6 + -11.37*62 — 1.895*39.911 (-55.3814;95.8814) Интервальный прогноз. Определим среднеквадратическую ошибку прогнозируемого показателя.

где L — период упреждения; уn+L — точечный прогноз по модели на (n + L)-й момент времени; n — количество наблюдений во временном ряду; Sy — стандартная ошибка прогнозируемого показателя; Tтабл — табличное значение критерия Стьюдента для уровня значимости а и для числа степеней свободы, равного n — 2. Точечный прогноз, t = 10: y(10) = -11.37*10 2 + 88.47* + 2151.09 = 1898.79 K1 = 247.4924 1898.79 — 247.4924 = 1651.2976 ; 1898.79 + 247.4924 = 2146.2824 t = 10: (1651.2976;2146.2824) Точечный прогноз, t = 11: y(11) = -11.37*11 2 + 88.47* + 2151.09 = 1748.49 K2 = 261.9213 1748.49 — 261.9213 = 1486.5687 ; 1748.49 + 261.9213 = 2010.4113 t = 11: (1486.5687;2010.4113) Точечный прогноз, t = 12: y(12) = -11.37*12 2 + 88.47* + 2151.09 = 1575.45 K3 = 278.0099 1575.45 — 278.0099 = 1297.4401 ; 1575.45 + 278.0099 = 1853.4599 t = 12: (1297.4401;1853.4599) Точечный прогноз, t = 13: y(13) = -11.37*13 2 + 88.47* + 2151.09 = 1379.67 K4 = 295.4871 1379.67 — 295.4871 = 1084.1829 ; 1379.67 + 295.4871 = 1675.1571 t = 13: (1084.1829;1675.1571) Точечный прогноз, t = 14: y(14) = -11.37*14 2 + 88.47* + 2151.09 = 1161.15 K5 = 314.1213 1161.15 — 314.1213 = 847.0287 ; 1161.15 + 314.1213 = 1475.2713 t = 14: (847.0287;1475.2713) 3. Проверка гипотез относительно коэффициентов линейного уравнения тренда. 1) t-статистика. Критерий Стьюдента.

Статистическая значимость коэффициента уравнения подтверждается

Статистическая значимость коэффициента тренда подтверждается Доверительный интервал для коэффициентов уравнения тренда Определим доверительные интервалы коэффициентов тренда, которые с надежность 95% будут следующими (tтабл=1.895): (a — tтабл·Sa; a + tтабл·Sa) (-20.5642;-2.1758) (b — t табл·Sb; b + tтаблb) (36.7313;140.2087) 2) F-статистика. Критерий Фишера.

Fkp = 5.32 Поскольку F > Fkp, то коэффициент детерминации статистически значим 4. Тест Дарбина-Уотсона на наличие автокорреляции остатков для временного ряда.

y y(x) e i = y-y(x) e 2 (e i — e i-1 ) 2
2225.3 2228.19 -2.89 8.3521
2254.9 2282.55 -27.65 764.5225 613.0576
2332.3 2314.17 18.13 328.6969 2095.8084
2365.8 2323.05 42.75 1827.5625 606.1444
2295.4 2309.19 -13.79 190.1641 3196.7716
2303.9 2272.59 31.31 980.3161 2034.01
2166.7 2213.25 -46.55 2166.9025 6062.1796
2080.4 2131.17 -50.77 2577.5929 17.8084
2075.9 2026.35 49.55 2455.2025 10064.1024
11299.3121 24689.8824

Критические значения d1 и d2 определяются на основе специальных таблиц для требуемого уровня значимости a, числа наблюдений n и количества объясняющих переменных m. Не обращаясь к таблицам, можно пользоваться приблизительным правилом и считать, что автокорреляция остатков отсутствует, если 1.5

Как построить доверительный интервал нормального распределения в Excel

Поскольку интервал значений, в котором находится некоторая неизвестная величина, совпадает с областью, в которой могут изменяться значения этой величины, то вероятность правильности оценки данной величины стремится к нулю. Поэтому, принято устанавливать определенное значение вероятности для нахождения границ изменения некоторой величины. Значения, находящиеся между этими границами, называют доверительным интервалом.

Примечание:

Рассматриваемая функция была заменена функцией ДОВЕРИТ.НОРМ с версии Excel 2010. Функция ДОВЕРИТ была оставлена для обеспечения совместимости с документами, созданными в более ранних версиях табличного редактора.



Процедура вычисления

Этот метод используется при интервальной оценке различных статистических величин. Главная задача данного расчета – избавится от неопределенностей точечной оценки.

Способ 1: функция ДОВЕРИТ.НОРМ

Оператор ДОВЕРИТ.НОРМ, относящийся к статистической группе функций, впервые появился в Excel 2010. В более ранних версиях этой программы используется его аналог ДОВЕРИТ. Задачей этого оператора является расчет доверительного интервала с нормальным распределением для средней генеральной совокупности.

Его синтаксис выглядит следующим образом:

Все аргументы данного оператора являются обязательными.

Функция ДОВЕРИТ имеет точно такие же аргументы и возможности, что и предыдущая. Её синтаксис таков:

Как видим, различия только в наименовании оператора. Указанная функция в целях совместимости оставлена в Excel 2010 и в более новых версиях в специальной категории «Совместимость». В версиях же Excel 2007 и ранее она присутствует в основной группе статистических операторов.

Граница доверительного интервала определяется при помощи формулы следующего вида:

Где X – это среднее выборочное значение, которое расположено посередине выбранного диапазона.

Теперь давайте рассмотрим, как рассчитать доверительный интервал на конкретном примере. Было проведено 12 испытаний, вследствие которых были получены различные результаты, занесенные в таблицу. Это и есть наша совокупность. Стандартное отклонение равно 8. Нам нужно рассчитать доверительный интервал при уровне доверия 97%.

  1. Выделяем ячейку, куда будет выводиться результат обработки данных. Щелкаем по кнопке «Вставить функцию».

Значит, чтобы посчитать уровень значимости, то есть, определить значение «Альфа» следует применить формулу такого вида:

То есть, подставив значение, получаем:

Путем нехитрых расчетов узнаем, что аргумент «Альфа» равен 0,03. Вводим данное значение в поле.

Как известно, по условию стандартное отклонение равно 8. Поэтому в поле «Стандартное отклонение» просто записываем это число.

В поле «Размер» нужно ввести количество элементов проведенных испытаний. Как мы помним, их 12. Но чтобы автоматизировать формулу и не редактировать её каждый раз при проведении нового испытания, давайте зададим данное значение не обычным числом, а при помощи оператора СЧЁТ. Итак, устанавливаем курсор в поле «Размер», а затем кликаем по треугольнику, который размещен слева от строки формул.

Группа аргументов «Значения» представляет собой ссылку на диапазон, в котором нужно рассчитать количество заполненных числовыми данными ячеек. Всего может насчитываться до 255 подобных аргументов, но в нашем случае понадобится лишь один.

Данный оператор предназначен для расчета среднего арифметического значения выбранного диапазона чисел. Он имеет следующий довольно простой синтаксис:

Аргумент «Число» может быть как отдельным числовым значением, так и ссылкой на ячейки или даже целые диапазоны, которые их содержат.

Способ 2: функция ДОВЕРИТ.СТЮДЕНТ

Кроме того, в Экселе есть ещё одна функция, которая связана с вычислением доверительного интервала – ДОВЕРИТ.СТЮДЕНТ. Она появилась, только начиная с Excel 2010. Данный оператор выполняет вычисление доверительного интервала генеральной совокупности с использованием распределения Стьюдента. Его очень удобно использовать в том случае, когда дисперсия и, соответственно, стандартное отклонение неизвестны. Синтаксис оператора такой:

Как видим, наименования операторов и в этом случае остались неизменными.

Посмотрим, как рассчитать границы доверительного интервала с неизвестным стандартным отклонением на примере всё той же совокупности, что мы рассматривали в предыдущем способе. Уровень доверия, как и в прошлый раз, возьмем 97%.

  1. Выделяем ячейку, в которую будет производиться расчет. Клацаем по кнопке «Вставить функцию».

В поле «Альфа», учитывая, что уровень доверия составляет 97%, записываем число 0,03. Второй раз на принципах расчета данного параметра останавливаться не будем.

Как видим, инструменты программы Excel позволяют существенно облегчить вычисление доверительного интервала и его границ. Для этих целей используются отдельные операторы для выборок, у которых дисперсия известна и неизвестна.

Программа Эксель используется для выполнения различных статистических задач, одной из которых является вычисление доверительного интервала, который применяется как наиболее подходящая замена точечной оценки при малом объеме выборки.

Хотим сразу заметить, что сама процедура вычисления доверительного интервала довольно непростая, однако, в Excel существует ряд инструментов, призванных облегчить выполнение данной задачи. Давайте рассмотрим их.

Свойство статистики и распределения

Так как статистика по игреку строится таким образом, чтобы она была монотонной и непрерывной по тэте, то можно найти обратную функцию y-1. Для определённости принимают, что игрек по тэта монотонно возрастает. Тогда вероятность расположения будет эквивалентна неравенству: y-1(j/2) < t < y-1(-j/2). Отсюда можно получить доверительный интервал для тэта: P (S -(X | n |, j) < t < S +(X | n |, j)) = 1 — j. Где: S -(X | n |, j) = Y-1(y (a /2)), S +(X | n |, j) = Y-1(y (1- a /2).

Таким образом, определить доверительную вероятность попадания тэта в интервал от S- до S+ можно от значения обратной функции в точках, равняющихся квантили статистики игрек порядка j/2 и 1 — j/2. При этом когда рассматриваемая функция монотонно убывает, знаки в неравенстве меняются на противоположные.

Пользуясь общим подходом расчёта доверительных интервалов, можно посчитать вероятность для нормальной генеральной совокупности, опираясь на ряд утверждений. Пусть известна выборка X|n,| взятая из совокупности E ~ N (j, ς2), то есть имеющей нормальный закон распределения с математическим ожиданием j и дисперсией сигма в квадрате. Для такого состояния справедливо следующее:

  1. Функция вида (X-j) * √ n / ς соответствует стандартному нормальному закону распределения. Икс — это математическое ожидание неизвестного, из которого вычитается истинное значение для получения величины, имеющей нулевую вероятность. После этого величина центруется путём деления на среднее квадратичное отклонение: ς / √ n. Так как закон исходной генеральной совокупности нормальный, то и среднее арифметическое случайных величин будет являться нормально распределённой случайной величиной.
  2. Если статистика S2 не смещена от точки дисперсии, то функция (X — a) * √n / S будет подчиняться распределению Стьюдента с n — 1 степенью свободы.
  3. Статистика n — 1, умноженная на несмещённый центр дисперсии и отнесённая к истинному значению, подчиняется распределению хи-квадрат. В числителе формулы находится сумма квадратов нормальных распределений, которые приводятся к нормальным стандартам.
  4. Когда рассматривается смещённая оценка дисперсии, то статистика nS2 / ς2 соответствует распределению хи-квадрат с эн степенями свободы.
Понравилась статья? Поделиться с друзьями:
Самоучитель Брин Гвелл
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: