Как выполнить один образец и два образца z-тестов в excel

Как выполнить расчет z-теста в excel (пошаговый пример)

Распределение Фишера (F-распределение). Распределения математической статистики в EXCEL

history 12 ноября 2016 г.

Распределения вероятностей

Рассмотрим распределение Фишера (F-распределение). С помощью функции MS EXCEL F .РАСП() построим графики функции распределения и плотности вероятности, поясним применение этого распределения для целей математической статистики.

F-распределение (англ. F-distribution) применяется для целей дисперсионного анализа (ANOVA), при проверке гипотезы о равенстве дисперсий двух нормальных распределений (F-тест) и др.

Определение : Если U 1 и U 2 независимые случайные величины, имеющие ХИ2-распределение с k 1 и k 2степенями свободы соответственно, то распределение случайной величины:

носит название F -распределения с параметрами k 1 и k 2 .

Плотность F -распределения выражается формулой:

где Г(…) – гамма-функция:

если альфа – положительное целое, то Г( альфа )=( альфа -1)!

Приведем пример случайной величины, имеющей F -распределение.

Пусть имеется 2 нормальных распределения N(μ 11 ) и N(μ 2 ; σ 2 ), из которых сделаны выборки размером n 1 и n 2 . Если s 1 2 и s 2 2 – дисперсии этих выборок , то отношение

имеет F -распределение. Это соотношение нам потребуется при проверке гипотезы о равенстве дисперсий двух нормальных распределений (F-тест) .

Графики функций

В файле примера на листе График приведены графики плотности распределения вероятности и интегральной функции распределения .

Примечание : Для построения функции распределения и плотности вероятности можно использовать диаграмму типа График или Точечная (со сглаженными линиями и без точек). Подробнее о построении диаграмм читайте статью Основные типы диаграмм .

F-распределение в MS EXCEL

В MS EXCEL, начиная с версии 2010, для F-распределения имеется специальная функция F.РАСП() , английское название – F.DIST(), которая позволяет вычислить плотность вероятности (см. формулу выше) и интегральную функцию распределения (вероятность, что случайная величина Х, имеющая F — распределение , примет значение меньше или равное х, P(X Примечание Плотность вероятности можно также вычислить впрямую, с помощью формул (см. файл примера ).

До MS EXCEL 2010 в EXCEL была функция FРАСП() , которая позволяет вычислить функцию распределения (точнее — правостороннюю вероятность, т.е. P(X>x)). Функция FРАСП() оставлена в MS EXCEL 2010 для совместимости. Аналогом FРАСП() является функция F.РАСП.ПХ() , появившаяся в MS EXCEL 2010.

Примеры расчетов приведены в файле примера на листе Функции .

В MS EXCEL имеется еще одна функция, использующая для расчетов F-распределение – это F.ТЕСТ(массив1;массив2) . Эта функция возвращает результат F-теста : двухстороннюю вероятность того, что разница между дисперсиями выборок «массив1» и «массив2» несущественна. Предполагается, что выборки делаются из нормального распределения .

Обратная функция F-распределения

Обратная функция используется для вычисления альфа — квантилей , т.е. для вычисления значений x при заданной вероятности альфа , причем х должен удовлетворять выражению P

Функция F.ОБР.ПХ() используется для вычисления верхнего квантиля . Т.е. если в качестве аргумента функции указан уровень значимости, например 0,05, то функция вернет такое значение случайной величины х, для которого P(X>x)=0,05. В качестве сравнения: функция F.ОБР() вернет такое значение случайной величины х, для которого P(X F.ОБР.ПХ() использовалась функция FРАСПОБР() .

Вышеуказанные функции можно взаимозаменять, т.к. следующие формулы возвращают одинаковый результат: =F.ОБР(0,05;k1;k2) =F.ОБР.ПХ(1-0,05;k1;k2) = FРАСПОБР (1-0,05;k1;k2)

СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье Распределения случайной величины в MS EXCEL .

Как провести двухвыборочный t-тест в Excel

Предположим, исследователи хотят знать, имеют ли два разных вида растений в определенной стране одинаковую среднюю высоту. Поскольку обход и измерение каждого растения заняло бы слишком много времени, они решили собрать образец из 20 растений каждого вида.

На следующем изображении показана высота (в дюймах) каждого растения в каждом образце:

Мы можем провести двухвыборочный t-тест, чтобы определить, имеют ли два вида одинаковую среднюю высоту, используя следующие шаги:

Шаг 1: Определите, равны ли дисперсии генеральной совокупности .

Когда мы проводим двухвыборочный t-критерий, мы должны сначала решить, будем ли мы предполагать, что две совокупности имеют равные или неравные дисперсии. Как правило, мы можем предположить, что совокупности имеют равные дисперсии, если отношение большей выборочной дисперсии к меньшей выборочной дисперсии составляет менее 4:1.

Мы можем найти дисперсию для каждого образца, используя функцию Excel =VAR.S(диапазон ячеек) , как показано на следующем рисунке:

Отношение большей дисперсии выборки к меньшей дисперсии выборки составляет 12,9053 / 8,1342 = 1,586 , что меньше 4. Это означает, что мы можем предположить, что дисперсии генеральной совокупности равны.

Шаг 2: Откройте пакет инструментов анализа .

На вкладке «Данные» на верхней ленте нажмите «Анализ данных».

Если вы не видите этот вариант для выбора, вам необходимо сначала загрузить пакет инструментов анализа , который является совершенно бесплатным.

Шаг 3: Выберите подходящий тест для использования.

Выберите вариант с надписью t-Test: Two-Sample Assassining Equal Variances и нажмите OK.

Шаг 4: Введите необходимую информацию .

Введите диапазон значений для переменной 1 (наша первая выборка), переменной 2 (наша вторая выборка), гипотетической средней разницы (в этом случае мы поместили «0», потому что мы хотим знать, равна ли истинная средняя разница генеральной совокупности 0), и выходной диапазон, в котором мы хотели бы видеть результаты t-теста. Затем нажмите ОК.

Шаг 5: интерпретируйте результаты .

После того, как вы нажмете OK на предыдущем шаге, отобразятся результаты t-теста.

Вот как интерпретировать результаты:

Среднее значение: это среднее значение для каждого образца. Образец 1 имеет среднюю высоту 15,15 , а образец 2 имеет среднюю высоту 15,8 .

Дисперсия: это дисперсия для каждого образца. Выборка 1 имеет дисперсию 8,13 , а выборка 2 — 12,90 .

Наблюдения: это количество наблюдений в каждой выборке. Обе выборки содержат по 20 наблюдений (например, по 20 отдельных растений в каждой выборке).

Объединенная дисперсия: Число , которое рассчитывается путем «объединения» дисперсий каждой выборки вместе по формуле +n 2 -2), что оказывается равным 10,51974.Это число позже используется при вычислении тестовой статистики t .

Гипотетическая средняя разница: число, которое мы «предполагаем», представляет собой разницу между двумя средними значениями совокупности. В данном случае мы выбрали , потому что хотим проверить, равна ли разница между двумя популяциями в среднем 0, например, разницы нет.

df: Степени свободы для t-критерия, рассчитанные как n 1 + n 2 -2 = 20 + 20 – 2 = 38 .

t Stat: тестовая статистика t , рассчитанная как t = / √ [ s 2 p (1/n 1 + 1/n 2 )]

В этом случае t = / √ [10,51974(1/20+1/20)] = -0,63374 .

СРЗНАЧ (функция СРЗНАЧ)

В этой статье описаны синтаксис формулы и использование функции С AVERAGE в Microsoft Excel.

Описание

Возвращает среднее арифметическое аргументов. Например, если диапазон A1:A20 содержит числа, формула =СПБ(A1:A20) возвращает среднее из этих чисел.

Синтаксис

Аргументы функции СРЗНАЧ описаны ниже.

Число1 Обязательный аргумент. Первое число, ссылка на ячейку или диапазон, для которого требуется вычислить среднее значение.

Число2. Необязательный. Дополнительные числа, ссылки на ячейки или диапазоны, для которых нужно вычесть среднее значение, не более 255.

Замечания

Аргументы могут быть числами, именами или ссылками на диапазоны или ячейки, содержащие числа.

Логические значения и текстовые представления чисел, которые непосредственно введите в список аргументов, не учитываются.

Если аргумент является ссылкой на диапазон или ячейку, содержащую текст или логические значения, или ссылкой на пустую ячейку, то такие значения игнорируются; однако ячейки, которые содержат нулевые значения, учитываются.

Аргументы, являющиеся значениями ошибок или текстом, которые не могут быть преобразованы в числа, вызывают ошибки.

Если логические значения и текстовые представления чисел необходимо учитывать в расчетах, используйте функцию СРЗНАЧА.

Если требуется вычислить среднее значение только для тех значений, которые удовлетворяют определенным критериям, используйте функцию СРЗНАЧЕСЛИ или СРЗНАЧЕСЛИМН.

Примечание: Функция СРЗНАЧ вычисляет среднее значение, то есть центр набора чисел в статистическом распределении. Существует три наиболее распространенных способа определения среднего значения, описанных ниже.

Среднее значение — это среднее арифметическое, которое вычисляется путем сложения набора чисел с последующим делением полученной суммы на их количество. Например, средним значением для чисел 2, 3, 3, 5, 7 и 10 будет 5, которое является результатом деления их суммы, равной 30, на их количество, равное 6.

Медиана — это число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана. Например, медианой для чисел 2, 3, 3, 5, 7 и 10 будет 4.

Мода — это число, наиболее часто встречающееся в данном наборе чисел. Например, модой для чисел 2, 3, 3, 5, 7 и 10 будет 3.

При симметричном распределении множества чисел все три значения центральной тенденции будут совпадать. При ассиметричном распределении множества чисел они могут отличаться.

Совет: При вычислении средних значений ячеек следует учитывать различие между пустыми ячейками и ячейками, содержащими нулевые значения, особенно если в диалоговом окне Параметры Excel настольного приложения Excel снят флажок Показывать нули в ячейках, которые содержат нулевые значения. Если этот флажок установлен, пустые ячейки игнорируются, но нулевые значения учитываются.

Местонахождение флажка Показывать нули в ячейках, которые содержат нулевые значения

Откройте вкладку Файл , а затем нажмите кнопку Параметры и в категории Дополнительно найдите группу Показать параметры для следующего листа.

Пример

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу ВВОД. При необходимости измените ширину столбцов, чтобы видеть все данные.

Статистическая значимость

Проверка статистической значимости изначально разрабатывалась независимо от проверки статистических гипотез, однако сегодня оба подхода очень часто используются во взаимодействии друг с другом. Задача проверки статистической значимости состоит в том, чтобы установить порог, за пределами которого мы решаем, что наблюдаемые данные больше не поддерживают нулевую гипотезу.

Следовательно, существует два риска:

  • Мы можем принять расхождение как значимое, когда на самом деле оно возникло случайным образом

  • Мы можем приписать расхождение случайности, когда на самом деле оно показывает истинное расхождение с популяцией

Эти две возможности обозначаются соответственно, как ошибки 1-го и 2-го рода:

H ложная

H истинная

Отклонить H 

Истинноотрицательный исход

Ошибка 1-го рода (ложноположительный исход)

Принять H 

Ошибка 2-го рода (ложноотрицательный исход)

Истинноположительный исход

Чем больше мы уменьшаем риск совершения ошибок 1-го рода, тем больше мы увеличиваем риск совершения ошибок 2-го рода. Другими словами, с чем большей уверенностью мы хотим не заявлять о наличии расхождения, когда его нет, тем большее расхождение между выборками нам потребуется, чтобы заявить о статистической значимости. Эта ситуация увеличивает вероятность того, что мы проигнорируем подлинное расхождение, когда мы с ним столкнемся.

В статистической науке обычно используются два порога значимости. Это уровни в 5% и 1%. Расхождение в 5% обычно называют значимым, а расхождение в 1% — крайне значимым. В формулах этот порог часто обозначается греческой буквой α (альфа) и называется уровнем значимости. Поскольку, отсутствие эффекта по результатам эксперимента может рассматриваться как неуспех (эксперимента либо обновленного веб-сайта, как в нашем случае), то может возникнуть желание корректировать уровень значимости  до тех пор, пока эффект не будет найден. По этой причине классический подход к проверке статистической значимости требует, чтобы мы устанавливали уровень значимости до того, как обратимся к нашим данным. Часто выбирается уровень в 5%, и поэтому мы на нем и остановимся.

Как вы находите Z в долгосрочной перспективе?

Таким образом, мы вычисляем Z.лт = |SL – М| /С.lt, где SL — предел спецификации, M — среднее (среднее) и S.lt — долгосрочное стандартное отклонение. Долгосрочное стандартное отклонение задается как S.lt = sqrt[SS.

Как найти статистику Z в Excel?

Среднее значение оказывается равным 14.375, а стандартное отклонение — 4.998. Шаг 2: Найдите z-оценку для первого значения необработанных данных. Далее мы найдем z-оценку для первого значения необработанных данных, используя метод формула z = (X – μ) / σ. В ячейке C2 показана формула, которую мы использовали для вычисления значения z в ячейке B2.

Что означает z-тест для двух выборок? Двухвыборочный Z-тест. Двухвыборочный Z-тест используется для сравнить средние значения двух выборок, чтобы увидеть, возможно ли, что они принадлежат к одной и той же популяции. Нулевая гипотеза: средние по численности населения равны.

Как вы выполняете два образца z-теста в Excel?

Шаги для запуска независимого t-теста


  • Шаг 1:

    Определите представленные образцы. Эти образцы должны быть хотя бы приблизительно нормальными.

  • Шаг 2:

    Обычно это выходит за рамки того, что требуется для проведения формальных статистических тестов, и в этом случае вы хотели бы

    создать гистограмму

    образцов, чтобы увидеть, выглядят ли они хотя бы приблизительно в форме колокола


  • Шаг 3:

    Если вам нужно официально проверить нормальность образцов, вы можете использовать это

    Калькулятор теста на нормальность


  • Шаг 4:

    После того, как вы очистите предположения (при необходимости), вы можете приступить к выполнению фактического t-теста.

  • Шаг 5:

    Один из предыдущих шагов, который также необходим, касается оценки того, можно ли предположить, что стандартные отклонения совокупности равны или нет.

Зачем нам нужно проверять равенство дисперсий генеральной совокупности? Это связано с тем, что необходимо найти стандартную ошибку для теста, и оказывается, что оптимальный выбор стандартной ошибки зависит от того, равны ли стандартные отклонения генеральной совокупности или нет.

Это довольно техническая тема, но с точки зрения непрофессионала, если дисперсии генеральной совокупности равны, то лучший выбор состоит в том, чтобы в основном объединить доступные выборочные дисперсии, чтобы получить хорошую оценку стандартной ошибки.

Но если они не равны, все немного усложняется, и нужны некоторые технические поправки, что, как вы видите, отражается в том, что используемая формула другая, и степени свободы тоже разные.

Пример

Мы предполагаем, что следующие данные взяты из простой случайной выборки нормально распределенной совокупности с неизвестным средним и стандартным отклонением 3:

1, 2, 3, 3, 4 , 4, 8, 10, 12

При уровне значимости 10% мы хотим проверить гипотезу о том, что данные выборки взяты из генеральной совокупности со средним большим чем 5. Более формально мы имеем следующие гипотезы:

  • H : μ = 5
  • H a : μ> 5

Мы используем Z. ТЕСТ в Excel, чтобы найти значение p для этой проверки гипотезы.

  • Введите данные в столбец в Excel. Предположим, это от ячейки A1 до A9.
  • В другую ячейку введите = Z.TEST (A1: A9,5,3)
  • Результат – 0,41207.
  • Поскольку наше значение p превышает 10%, мы не можем отклонить нулевую гипотезу.

Z.TEST Функция может использоваться для тестов с нижним хвостом, а также для двусторонних тестов. Однако результат не такой автоматический, как в этом случае. Другие примеры использования этой функции см. Здесь.

Дисперсия в excel

Расчет дисперсии в Microsoft Excel

Вычисление дисперсии

​«Число1»​ диапазон ячеек, в​Среди множества показателей, которые​ и интервал переменной​ мы помним, p-значение​ вариабельности текущего процесса?​1​2​ гипотез о равенстве​ этого распределения (σ/√n)​приблизительно​ с помощью формулы​

Способ 1: расчет по генеральной совокупности

​ по нормальному закону,​ электрической лампочки.​. Поэтому цель использования​ так же, как​​ которых мы поговорим​​и выделяем область,​ котором содержится числовой​

​ 2 указаны ссылки​ сравнивается с уровнем​СОВЕТ​-1 и n​2. Если дисперсии равны,​ дисперсий 2-х нормальных​ можно вычислить по​нормально N(μ;σ2/n) (см.​ =НОРМ.СТ.ОБР((1+0,95)/2), см. файл​

​ попадет в интервал​Примечание: ​ доверительных интервалов состоит​

  1. ​ и в первом​ ниже.​ содержащую числовой ряд,​ ряд. Если таких​ нужно выделить расчет​​ вместе с заголовками​​ значимости 0,05, а​: Перед проверкой гипотез​
  2. ​2​​ то их отношение​​ распределений. Вычислим значение​​ формуле =8/КОРЕНЬ(25).​​ статью про ЦПТ).​​ примера Лист Интервал.​​ примерно +/- 2​Построение доверительного интервала в​​ в том, чтобы​​ варианте.​Выделяем на листе ячейку,​ на листе. Затем​ диапазонов несколько, то​​ дисперсии. Следует отметить,​​ столбцов, то эту​
  3. ​ не 0,05/2=0,025. Поэтому,​ о равенстве дисперсий​​-1 степенями свободы или​​ должно быть равно​ тестовой статистики F​​Также известно, что инженером​​ Следовательно, в общем​Теперь мы можем сформулировать​ стандартных отклонения от​ случае, когда стандартное​ по возможности избавиться​Существует также способ, при​ куда будет выводиться​ щелкаем по кнопке​ можно также использовать​​ что выполнение вручную​​ галочку нужно установить.​​ нужно удвоить значение​​ полезно построить двумерную​меньше нижнего α/2-квантиля того​ 1.​0​​ была получена точечная​​ случае, вышеуказанное выражение​
  4. ​ вероятностное утверждение, которое​ среднего значения (см.​ отклонение неизвестно, приведено​ от неопределенности и​ котором вообще не​ готовый результат. Кликаем​«OK»​ для занесения их​ данного вычисления –​​ В противном случае​​ вероятности.​

​ гистограмму, чтобы визуально​​ же распределения.​

Способ 2: расчет по выборке

​Как известно, точечной оценкой​, рассмотрим процедуру «двухвыборочный​ оценка параметра μ​ для доверительного интервала​ послужит нам для​ статью про нормальное​ в статье Доверительный​ сделать как можно​ нужно будет вызывать​ на кнопку​.​ координат в окно​ довольно утомительное занятие.​ надстройка не позволит​Примечание​ определить разброс данных​

​ дисперсии распределения σ2​ F-тест», вычислим Р-значение​ равная 78 мсек​ является лишь приближенным.​ формирования доверительного интервала:​

  1. ​ распределение). Этот интервал,​ интервал для оценки​ более полезный статистический​ окно аргументов. Для​​«Вставить функцию»​​Результат вычисления будет выведен​
  2. ​ аргументов поля​​ К счастью, в​​ провести вычисления и​​: Про p-значение можно​​ в обеих выборок.​​: Верхний α/2-квантиль -​​  может служить значение​ (Р-value), построим доверительный​ (Х​ Если величина х​​«Вероятность того, что​​ послужит нам прототипом​
  3. ​ среднего (дисперсия неизвестна)​ вывод.​ этого следует ввести​, расположенную слева от​ в отдельную ячейку.​«Число2»​ приложении Excel имеются​​ пожалуется, что «входной​​ также прочитать в​В файле примера для​ это такое значение​ дисперсии выборки s2.​​ интервал. С помощью​​ср​
  4. ​ распределена по нормальному​ среднее генеральной совокупности​

​ для доверительного интервала.​​ в MS EXCEL. О​Примечание​

​ формулу вручную.​ строки функций.​Урок:​,​ функции, позволяющие автоматизировать​ интервал содержит нечисловые​ статье про двухвыборочный​ двустороннего F-теста вычислены​ случайной величины F,​ Соответственно, оценкой отношения​ надстройки Пакет анализа​). Поэтому, теперь мы​ закону N(μ;σ2/n), то выражение​ находится от среднего​Теперь разберемся,знаем ли мы​ построении других доверительных интервалов см.​: Процесс обобщения данных​

​Выделяем ячейку для вывода​

lumpics.ru>

Расчет среднего квадратичного отклонения в Microsoft Excel

​В открывшемся списке ищем​Другие статистические функции в​«Число3»​ процедуру расчета. Выясним​ данные»;​ z-тест.​ границы соответствующего двустороннего​ что P(F>= F​ дисперсий σ​ сделаем «двухвыборочный F-тест​ можем вычислять вероятности,​

​ распределение, чтобы вычислить​ стат

FРАСПОБР (функция FРАСПОБР)

​ раздел «Анализ данных»,​ 23 предприятий о:​расч​10​ с применяемыми функциями​

​799 000 000,00 ₽​ математического описания функции​Знаменатель степеней свободы​ определить критическое значение​Вероятность​0,9729551​ используется для проверки​ вычисления верхнего квантиля.​ правостороннюю вероятность, т.е.​В файле примера на​2​

​Определение​​ где можно произвести​ X — цена​Регрессия​Стандартное отклонение для rxy​ в пакете Excel​85 000 000,00 ₽​ ФИШЕР, имеет вид:​Формула​ F, нужно использовать​ — обязательный аргумент.​Возвращает значение, обратное (правостороннему)​ гипотез с помощью​ Т.е. если в​ P(X>x)). Функция FРАСП()​ листе График приведены​

​), из которых сделаны​: Если U​ математическую статистику. Мне​ на товар А,​

Синтаксис

​=КОРЕНЬ((1-C8^2)/4)​ приведены на рисунке​

​Схема решения таких задач​​Z’=1/2*ln(1+x)/(1-x)​Описание​ уровень значимости как​

​ Вероятность, связанная с​​ F-распределению вероятностей. Если​ коэффициента корреляции.​

​ качестве аргумента функции​​ оставлена в MS​ графики плотности распределения​

Замечания

​ выборки размером n​1​ нужно расчитать критерий​ тыс. руб.; Y​

​227,407​Таким образом, с вероятностью​ 1.​

​ выглядит следующим образом:​Рассмотрим применение данной функции​Результат​ аргумент «вероятность» функции​

​ интегральным F-распределением.​ p = FРАСП(x;. ),​ФИШЕР(x)​ указан уровень значимости,​ EXCEL 2010 для​

​ вероятности и интегральной​1​и U​ Фишера. Его можно​ — прибыль торгового​

​7,075​ 0,95 линейный коэффициент​Рисунок 1 – Пример​Рассчитывается линейный коэффициент корреляции​ на 3-x конкретных​=FРАСПОБР(A2;A3;A4)​ FРАСПОБР.​Степени_свободы1​ то FРАСПОБР(p;. ) =​Аргументы функции ФИШЕР описаны​ например 0,05, то​ совместимости. Аналогом FРАСП()​ функции распределения.​и n​

​2​ вычислить двумя способами.​ предприятия, млн. руб,​Остаток​ корреляции заключен в​ расчетов.​ r​ примерах.​Значение, обратное F-распределению вероятностей​По заданному значению вероятности​ — обязательный аргумент.​ x.​ ниже.​ функция вернет такое​

Пример

​ является функция F.РАСП.ПХ(),​Примечание​2​независимые случайные величины,​ Есть раздел «Регрессия»​ производится изучение их​1607,014​ интервале от (–0,386)​№ п/п​xy​​ для приведенных выше​ функция FРАСПОБР ищет​

​ Числитель степеней свободы.​

​F-распределение может использоваться в​

​ значение случайной величины​ появившаяся в MS​

​: Для построения функции​

​ имеющие ХИ2-распределение с​

​ и «Однофакторный дисперсионный​

​ зависимости. Оценка регрессионной​

​;​Пример 1. Используя данные​ данных​

Функция проверки Excel Z

Excel Z TEST — это своего рода проверка гипотез, которая используется для проверки альтернативной гипотезы против нулевой гипотезы. Нулевая гипотеза — это гипотеза, которая относится к общему утверждению в целом. Путем проверки гипотезы мы пытаемся доказать, что нулевая гипотеза ложна против альтернативной гипотезы.

Z-ТЕСТ — одна из таких функций проверки гипотез. Это проверяет среднее значение двух наборов данных выборки, когда дисперсия известна и размер выборки большой. Размер выборки должен быть> = 30, иначе нам нужно использовать T-TEST. Для ZTEST нам нужно иметь две независимые точки данных, которые не связаны друг с другом или не влияют друг на друга, и данные должны быть нормально распределены.

Синтаксис

Z.TEST — это встроенная функция в Excel. Ниже приведена формула функции Z.TEST в excel.

  • Массив: это диапазон ячеек, содержащий точки данных, по которым нам нужно проверить X. Это значение ячеек по сравнению со средним значением выборки гипотез, которое необходимо проверить.
  • X: Из массива проверяемое значение X.
  • Сигма: это стандартное отклонение для всего населения. Это необязательный аргумент, если он не указан, используйте стандартное отклонение образца.

Как выполнить тест Z в Excel? (с примерами)

Пример # 1 — Использование формулы Z-теста

Например, посмотрите на данные ниже.

Используя эти данные, мы рассчитаем одностороннее значение вероятности Z TEST. Для этого предположим, что среднее значение гипотезы равно 6.

Шаг 1. Итак, откройте формулу Z TEST в ячейке Excel.

Шаг 2: Выберите массив в качестве баллов, то есть от A2 до A11.

Шаг 3: Следующий аргумент — «X» . Поскольку мы уже предположили, что предполагаемое среднее значение совокупности равно 6, примените это значение к этому аргументу.

Шаг 4. Последний аргумент является необязательным, поэтому закройте формулу, чтобы получить значение Z TEST.

Шаг 5: Это одностороннее значение Z TEST, чтобы получить двустороннее значение Z TEST для умножения этого значения на 2.

Пример # 2 — Z-ТЕСТ с использованием опции анализа данных

Мы можем провести Z TEST, используя опцию анализа данных в Excel. Чтобы сравнить два средних значения, когда дисперсия известна, мы используем Z TEST. Здесь мы можем сформулировать две гипотезы, одна — «Нулевая гипотеза», а другая — «Альтернативная гипотеза», ниже приводится уравнение обеих этих гипотез.

H0: μ1 — μ2 = 0 (нулевая гипотеза)

H1: μ1 — μ2 ≠ 0 (альтернативная гипотеза)

Альтернативная гипотеза (H1) утверждает, что два средних значения совокупности не равны.

В этом примере мы будем использовать результаты двух учеников по нескольким предметам.

Шаг 1: Первое, что нам нужно сделать, это вычислить переменные для этих двух значений с помощью функции VAR.P.

Шаг 2: Теперь перейдите на вкладку «Данные» и нажмите «Анализ данных».

Прокрутите вниз и выберите z-Test Two Sample для средних и нажмите Ok.

Шаг 3. Для диапазона переменной 1 выберите баллы «Студент 1», а для диапазона переменной 2 выберите баллы «Студент 2».

Шаг 4: Переменная 1 Дисперсия выберите Оценка дисперсии учащегося 1 и Переменная 1 Дисперсия выберите Оценка дисперсии учащегося 2.

Шаг 5: Выберите диапазон вывода в качестве ячейки и нажмите ОК.

мы получили результат.

Если Z <- Z Critical Two Tailor  Z> Z Critical Two Tail, то мы можем отклонить нулевую гипотезу.

Итак, из результата ZTEST ниже приведены результаты.

  • Z <- Z Критический два хвоста = -1,080775083> — 1,959963985
  • Z> Z Критический двуххвостый = -1,080775083 <1,959963985

Поскольку он соответствует нашим критериям, мы не можем отклонить нулевую гипотезу. Таким образом, средства двух учеников существенно не различаются.

  • Все аргументы должны иметь числовые значения, иначе мы получим # ЗНАЧЕНИЕ !.
  • Значение массива должно содержать числа, иначе мы получим ошибку # N / A.
  • ZTEST можно применять к большим наборам данных.
Понравилась статья? Поделиться с друзьями:
Самоучитель Брин Гвелл
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: