Как сделать график распределения в excel?

Шаблон excel для проверки законов распределения данных наблюдений по критерию согласия пирсона | статья в журнале «молодой ученый»

Свойства функции распределения

  1. $F\left(x\right)$ — функция неубывающая, т.е. при $x_{1}

По теореме сложения вероятностей несовместных событий получим:

$F\left(x_{2} \right)-F\left(x_{1} \right)=P\left(x_{1} \le X

а поэтому

$F\left(x_{2} \right)-F\left(x_{1} \right)\ge 0$ или $F\left(x_{2} \right)\ge F\left(x_{1} \right)$,

что и требовалось доказать.

  1. Вероятность того, что случайная величина попадет на участок $\left[a;b\right)$, равна приращению интегральной функции распределения на этом участке.

Это утверждение следует непосредственно из первого свойства. Действительно, если положим $x_{1} =a,{\rm \; }x_{2} =b$, то получим:

$F\left(-\infty \right)=0$.

Это свойство следует из того, что $\left(X

  1. $F\left(+\infty \right)=1$.

Это свойство следует из того, что $\left(X

График функции распределения $F\left(x\right)$ есть график неубывающей функции, значения которой меняются от $0$ до $1$.

Примеры решенных задач

Задача 1. В магазине имеется 15 автомобилей определенной марки. Среди них 7 черного цвета, 6 серого и 2 белого. Представители фирмы обратились в магазин с предложением о продаже им 3 автомобилей этой марки, безразлично какого цвета. Составьте ряд распределения числа проданных автомобилей черного цвета при условии, что автомобили отбирались случайно.

Задача 2. В магазине продаются 5 отечественных и 3 импортных телевизора. Составить закон распределения случайной величины – числа импортных из четырех наудачу выбранных телевизоров. Найти функцию распределения этой случайной величины и построить ее график.

Задача 3. В партии из шести деталей имеется четыре стандартных. Наудачу отобраны три детали. Составить закон распределения дискретной случайной величины X — числа стандартных деталей среди отобранных.

Задача 4. Составить закон распределения числа карт трефовой масти среди четырех взятых наугад из колоды карт. Построить многоугольник распределения. Найти математическое ожидание и дисперсию случайной величины.

Задача 5. В партии из 11 изделий 5 имеют скрытые дефекты. Наугад выбраны 4 изделия. Пусть X — число бракованных изделий среди выбранных. Напишите закон распределения для случайной величины X и вычислите ее математическое ожидание.

Задача 6. В стопке из 6 книг 3 книги по математике и 3 по информатике. Выбирают наудачу три книги. Составить закон распределения числа книг по математике среди отобранных. Найти математическое ожидание и функцию распределения этой случайной величины.

Задача 9. В коробке 20 одинаковых клубков ниток, из них – 4 клубка с красными нитками. Наудачу вынимают 2 клубка. Найти закон распределения числа клубков с красными нитками.

Задача 10. В сборной команде института по стрельбе 16 человек, из них 6 перворазрядников. Наудачу выбирают двух членов сборной. Составьте закон распределения дискретной случайной величины $Х$ – числа перворазрядников среди выбранных. Найдите числовые характеристики этой случайной величины, функцию $F(x)$ и постройте ее график.

Шаг № 6: Настройте таблицу меток.

Технически у вас есть кривая колокола. Но его будет трудно прочитать, поскольку в нем отсутствуют какие-либо данные, описывающие это.

Давайте сделаем нормальное распределение более информативным, добавив метки, иллюстрирующие все значения стандартного отклонения ниже и выше среднего (вы также можете использовать их для отображения z-значений).

Для этого создайте еще одну вспомогательную таблицу следующим образом:

Сначала скопируйте среднее значение (F1) рядом с соответствующей ячейкой в ​​столбце X-Value (I5).

Затем вычислите значения стандартного отклонения ниже среднего, введя эту простую формулу в ячейка I4:

1 = I5- $ F $ 2

Проще говоря, формула вычитает сумму предыдущих значений стандартного отклонения из среднего. Теперь перетащите маркер заполнения вверх, чтобы скопировать формулу в оставшиеся две ячейки (I2: I3).

Повторите тот же процесс для стандартных отклонений выше среднего, используя зеркальную формулу:

1 = I5 + $ F $ 2

Таким же образом выполните формулу для двух других ячеек (I7: I8).

Наконец, заполните значения метки оси Y (J2: J8) с нулями, так как вы хотите, чтобы маркеры данных располагались на горизонтальной оси.

Шаг № 10: Вставьте и разместите метки пользовательских данных.

По мере того, как вы совершенствуете свою диаграмму, не забудьте добавить пользовательские метки данных. Сначала щелкните правой кнопкой мыши любую точку, представляющую Серия «Series2» и выберите «Добавьте метки данных.”

Затем замените метки по умолчанию на те, которые вы установили ранее, и поместите их над маркерами данных.

  1. Щелкните правой кнопкой мыши на любом Серия «Series2» метка данных.
  2. Выбирать «Отформатируйте метки данных.”
  3. На панели задач переключитесь на Параметры метки таб.
  4. Проверить «Значение X» коробка.
  5. Снимите флажок «Значение Y» коробка.
  6. Под «Положение ярлыка,» выбирать «Выше.”

Кроме того, теперь вы можете удалить линии сетки (щелкните их правой кнопкой мыши> Удалить).

На какие вопросы отвечает гистограмма распределения?

Гистограмма – это один из моих самых любимых типов диаграмм, поскольку она дает огромное количество информации о данных.

В данном случае мы хотим знать, как много участников окажется в возрастных группах 20-ти, 30-ти, 40-ка лет и так далее. Гистограмма наглядно покажет это, поэтому определить закономерности и отклонения будет довольно легко.

«Неужели наше мероприятие не интересно гражданам в возрасте от 20 до 29 лет?»

Возможно, мы захотим немного изменить детализацию картины и разбить население на две возрастные группы. Это покажет нам, что в мероприятии примут участие большей частью молодые люди:

Построение графика нормального распределения

Прежде всего необходимо разбить наш массив на периоды. Для этого определяем минимальное и максимальное значение, размер каждого периода или шаг, с которым будет увеличиваться период.

Далее строим таблицу с категориями. Нижняя граница (B11) равняется округленному вниз ближайшему кратному числу. Остальные категории увеличиваются на значение шага. Формула в ячейке B12 и последующих будет выглядеть:

=ЕСЛИ(A12;B11+$B$6; «»)

В столбце X будет производится подсчет количества переменных в заданном промежутке. Для этого воспользуемся формулой ЧАСТОТА(), которая имеет два аргумента: массив данных и массив интервалов. Выглядеть формула будет следующим образом =ЧАСТОТА(Data!A1:A175;B11:B20). Также стоит отметить, что в таком варианте данная функция будет работать как формула массива, поэтому по окончании ввода необходимо нажать сочетание клавиш Ctrl+Shift+Enter.

Таким образом у нас получилась таблица с данными, с помощью которой мы сможем построить диаграмму с нормальным распределением. Воспользуемся диаграммой вида Гистограмма с группировкой, где по оси значений будет отложено количество переменных в данном промежутке, а по оси категорий – периоды.

Осталось отформатировать диаграмму и наш график с нормальным распределением готов.

Итак, мы познакомились с вами с нормальным распределением, узнали, что Excel позволяет генерировать массив данных с помощью формулы НОРМ.ОБР() для определенного среднего значения и стандартного отклонения и научились приводить данный массив в графический вид.

Для лучшего понимания, вы можете скачать файл с примером построения нормального распределения.

Построим диаграмму распределения в Excel. А также рассмотрим подробнее функции круговых диаграмм, их создание.

Пример 2

Колода испанской колоды состоит из 40 карт, из которых 10 имеют золото, а остальные 30 — нет. Предположим, что из этой колоды случайным образом вытягиваются 7 карт, которые не включаются в колоду.

Если X — количество золотых, присутствующих в 7 вытянутых картах, то вероятность получить x золотых при розыгрыше 7 карт определяется гипергеометрическим распределением P (40,10,7; x).

Давайте посмотрим на это так: для расчета вероятности получения 4 золотых при розыгрыше 7 карт мы используем формулу гипергеометрического распределения со следующими значениями:

И результат: вероятность 4,57%.

Но если вы хотите узнать вероятность получения более 4 карт, вам необходимо добавить:

P (4) + P (5) + P (6) + P (7) = 5,20%

Решение системы вероятности методом ГАУССА в Excel

Задача представляет собой вычисление вероятности возможных значений при бросании двух костей.

Пример с игрой в кости является наиболее наглядным, так как мы имеем ограниченный набор данных, которые соответствуют вероятностям. Так, вероятность имеет значение от нуля до единицы, к которому стремится наблюдаемая частота при бесконечно большой выборке или повторении эксперимента.

Существует 36 возможных комбинаций. При этом, вероятность того, что при бросании двух костей выпадет 2 очка равна 1/36, а 7 очков – 1/6. Отобразим перечень возможных значений бросания двух игральных костей в таблице, приведя при этом все вероятности к общему знаменателю.

Однако, такой ряд данных не дает возможности для выявления полного распределения, поэтому следует отобразить данные об отдельных вероятностях в рассчитанную по функции распределения. Так необходимо, все вероятности просуммировать последовательно (1+2+3+4+5+6+5+4+3+2+1).

Теперь определяем коэффициент вероятности разделив по отдельности последовательную сумму вероятностей на максимально возможное количество комбинаций 36.

В первом случае нами были рассмотрены отдельные вероятности, во втором – сумма вероятностей от первого возможного значения до заданного.

Необходимо преобразовать диапазон ячеек D2:D13 в числовой формат данных, иначе при обращении на них функции ГАУСС будет иметь место ошибка.

В созданный рядом с первоначальной таблицей столбец E введем формулу, которая в качестве аргумента делает обращение к ячейке D2.

Далее, протянем формулу вниз по столбцу, и получим ряд вероятностей с использованием функции ГАУСС.

Для более наглядной визуализации, построим график вероятности:

NEGBINOM.DIST: отрицательное биноминальное распределение

Функция NEGBINOM.DIST находит вероятность того, что указанное число сбоев произойдет до указанного числа успехов, на основе константы вероятности успеха. Функция использует синтаксис

= NEGBINOM.DIST (number_f, число_успехи, вероятность_успех)

где number_f указанное количество сбоев, число_успехов указанное количество успехов, вероятность_успеха это вероятность успеха, а кумулятивным является переключатель, который вы установили на 0 или FALSE, если вы хотите кумулятивное распределение, и на 1 или TRUE, если вы хотите распределение вероятности.

Например, предположим, что вы оператор нефтедобывающей кошки и хотите знать, что вам не удастся найти нефть ровно в десяти скважинах, прежде чем вы найдете нефть только в одной скважине. Если вероятность успеха составляет 5 процентов, вы можете найти вероятность того, что вы потерпите неудачу десять раз, прежде чем приступить к бурению и поиску нефти, используя формулу

= NEGBINOM.DIST (10,2, .05,0)

который возвращает значение 0,016465266, указывающее, что существует менее 2-процентной вероятности того, что вы десять раз потерпите неудачу, прежде чем попасть в гашер.

Проблема 3

Предположим, вы управляете чартерной школой и принимаете учащихся через систему лотереи. У вас есть 734 претендента, из которых 321 мальчик и 413 девочек. Вы принимаете только первые 150 студентов, которые выбраны случайным образом. Учитывая, что в вашей школе больше девочек, чем мальчиков, вы надеетесь получить больше мальчиков в этом году. Предположим, вы хотите знать, каковы ваши шансы на поступление в школу 90 мальчиков (60% из 150).

Потратьте секунду, чтобы вычислить ваш ответ, затем просмотрите изображение ниже.

Вы должны были использоватьтак как это единичная вероятность. С помощьюВы должны были получить 3.1730164380350626e-06 … что составляет менее одного процента … Давайте посмотрим на изображение дистрибутива, чтобы увидеть, где у нас больше шансов.

Гипергеометрическое распределение задачи 3

Кажется, у нас будет больше шансов, если мы попытаемся получить около 65 мальчиков, но вероятность все еще довольно низка. Может быть, вы должны изменить свой процесс приема …

Харбин Маджонг Проблемы с открывающей рукой

В игре 3 масти, пронумерованных от 1 до 9, с 4 копиями каждой карты. Это до сих пор составляет 108 карт. Кроме того, есть 4 копии карты Чжун (красный блок стоит на изображении выше), в результате чего мы получаем 112 карт. В харбинском маджонге вы выигрываете на основе выполнения определенных условий в дополнение к выигрышной руке. Получив по крайней мере 3 карты Чжун в стартовую руку, вы выполняете почти все эти условия.

Дополнительные ресурсы

Если вам нужен видеоурок с информацией, представленной здесь, вы можете посмотреть видео ниже. Это тот, который я использовал, чтобы узнать о гипергеометрическом распределении.

До скорого,

Джон Де Иисус

Квартили непрерывного распределения

Если функция распределения F (х) случайной величины х непрерывна, то 1-й квартиль является решением уравнения F(х) =0,25, второй – F(х) =0,5, а третий F(х) =0,75.

Примечание : Подробнее о Функции распределения см. статью Функция распределения и плотность вероятности в MS EXCEL .

Если известна функция плотности вероятности p (х) , то 1-й квартиль можно найти из уравнения:

Например, решив аналитическим способом это уравнение для Логнормального распределения lnN(μ; σ 2 ), получим, что медиана (2-й квартиль ) вычисляется по формуле e μ или в MS EXCEL =EXP(μ). При μ=1, медиана равна 2,718.

Обратите внимание на точку Функции распределения , для которой F(х)=0,5 (см. картинку выше или файл примера , лист Квартиль-распределение)

Абсцисса этой точки равна 2,718. Это и есть значение 2-го квартиля ( медианы ), что естественно совпадает с ранее вычисленным значением по формуле e μ .

Примечание : Напомним, что интеграл от функции плотности вероятности по всей области задания случайной величины равен единице:

Поэтому, линии квартилей ( х=квартиль ) делят площадь под графиком функции плотности вероятности на 4 равные части.

Квартили в MS EXCEL

Чтобы вычислить в MS EXCEL квартили заданного распределения необходимо использовать соответствующую обратную функцию распределения .

При вычислении квартилей в MS EXCEL используются обратные функции распределения : НОРМ.СТ.ОБР() , ЛОГНОРМ.ОБР() , ХИ2.ОБР() , ГАММА.ОБР() и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье Распределения случайной величины в MS EXCEL .

Например, в MS EXCEL 1-й квартиль для логнормального распределения LnN(1;1) можно вычислить по формуле =ЛОГНОРМ.ОБР(0,25;1;1) , а 3-й квартиль для стандартного нормального распределения по формуле =НОРМ.СТ.ОБР(0,75) .

Геометрическое распределение в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Отрицательного
Биномиального распределения
имеется функция ОТРБИНОМ.РАСП()
, английское название NEGBINOM.DIST(), которая позволяет вычислить вероятность возникновения количества неудач
до получения заданного числа успеха при заданной вероятности успеха.

Для Геометрического распределения
второй аргумент этой функции должен быть 1, т.к. нас интересует только первый успех.

Это определение несколько отличается от формулировки приведенной выше, где вычисляется вероятность, что первый успех произойдет после x
испытаний
. Различие сводится к диапазону изменения диапазона x
: если вероятность определена через количество испытаний, то х
может принимать значения начиная с 1, а если через количество неудач, то – начиная с 0. Поэтому справедлива формула: p(x_неудач
)= p(x_испытаний
-1). См. файл примера лист Пример
, где приведено 2 способа расчета.

Ниже используется подход, принятый в функции MS EXCEL: через количество неудач.

Чтобы вычислить функцию плотности вероятности
p(x), см. формулу выше, необходимо установить четвертый аргумент в функции ОТРБИНОМ.РАСП()
равным ЛОЖЬ. Для вычисления , необходимо установить четвертый аргумент равным ИСТИНА.

Примечание

До MS EXCEL 2010 в EXCEL была функция ОТРБИНОМРАСП()
, которая позволяет вычислить только плотность вероятности
. В файле примера
приведена формула на основе функции ОТРБИНОМРАСП()
для вычисления интегральной функции распределения
. Там же приведена формула для вычисления вероятности через определение.

В файле примера
приведены графики плотности распределения вероятности
и интегральной функции распределения
.

Примечание
: Для удобства написания формул для параметра p в файле примера
создано .

Примечание
: В функции ОТРБИНОМ.РАСП()

при нецелом значении х
, . Например, следующие формулы вернут одно и тоже значение: ОТРБИНОМ.РАСП(2
; 1; 0,4; ИСТИНА)= ОТРБИНОМ.РАСП(2,9
; 1; 0,4; ИСТИНА)

Расчет децилей для дискретного ряда

  1. Определяем номер дециля по формуле: ,

  2. Если номер дециля – целое число, то значение дециля будет равно величине элемента ряда, которое обладает накопленной частотой равной номеру дециля. Например, если номер дециля равен 20, его значение будет равно значению признака с S =20 (накопленной частотой равной 20).

Если номер дециля – нецелое число, то дециль попадает между двумя наблюдениями. Значением дециля будет сумма, состоящая из значения элемента, для которого накопленная частота равна целому значению номера дециля, и указанной части (нецелая часть номера дециля) разности между значением этого элемента и значением следующего элемента.

Например, если номер дециля равна 20,25, дециль попадает между 20-м и 21-м наблюдениями, и его значение будет равно значению 20-го наблюдения плюс 1/4 разности между значением 20-го и 21-го наблюдений.

Задачи

Решения задач приведены в файле примера на листе Пример
.

Задача1
. Нефтяная компания бурит скважины для добычи нефти. Вероятность обнаружить нефть в скважине равна 20%. Какова вероятность, что первая нефть будет получена именно в третью попытку? Какова вероятность, что для обнаружения первой нефти потребуется три попытки?Решение1
: =ОТРБИНОМ.РАСП(3-1; 1; 0,2; ЛОЖЬ) =ОТРБИНОМ.РАСП(3-1; 1; 0,2; ИСТИНА)

Задача2
. Рейтинговое агентство делает опрос случайных прохожих в городе о любимой марке автомобиля. Пусть известно, что у 1% горожан любимым автомобилем является Lada
Granta
. Какова вероятность, что встретить первого почитателя этой марки автомобиля после опроса 10 человек?Решение2
: =ОТРБИНОМ.РАСП(10-1; 1; 0,01; ИСТИНА
)=9,56%

Можно выделить наиболее часто встречающиеся законы распределения дискретных случайных величин:

  • Биномиальный закон распределения
  • Пуассоновский закон распределения
  • Геометрический закон распределения
  • Гипергеометрический закон распределения

Для данных распределений дискретных случайных величин расчет вероятностей их значений, а также числовых характеристик (математическое ожидание, дисперсия, и т.д.) производится по определенных «формулам»

Поэтому очень важно знать данные типы распределений и их основные свойства

Ссылки

  1. Дискретные распределения вероятностей. Получено с: biplot.usal.es
  2. Статистика и вероятность. Гипергеометрическое распределение. Получено с: projectdescartes.org
  3. CDPYE-УГР. Гипергеометрическое распределение. Восстановлено с: ugr.es
  4. GeoGebra. Классическая геогебра, исчисление вероятностей. Восстановлено с geogebra.org
  5. Попробуй легко. Решенные задачи гипергеометрического распределения. Получено с: probafacil.com
  6. Minitab. Гипергеометрическое распределение. Получено с: support.minitab.com
  7. Университет Виго. Основные дискретные распределения. Получено с: anapg.webs.uvigo.es
  8. Vitutor. Статистика и комбинаторика. Получено с: vitutor.net
  9. Вайсштейн, Эрик В. Гипергеометрическое распределение. Получено с: mathworld.wolfram.com
  10. Wikipedia. Гипергеометрическое распределение. Получено с: es.wikipedia.com

Как построить диаграмму распределения в Excel

График нормального распределения имеет форму колокола и симметричен относительно среднего значения. Получить такое графическое изображение можно только при огромном количестве измерений. В Excel для конечного числа измерений принято строить гистограмму.

Внешне столбчатая диаграмма похожа на график нормального распределения. Построим столбчатую диаграмму распределения осадков в Excel и рассмотрим 2 способа ее построения.

Имеются следующие данные о количестве выпавших осадков:

Первый способ. Открываем меню инструмента «Анализ данных» на вкладке «Данные» (если у Вас не подключен данный аналитический инструмент, тогда читайте как его подключить в настройках Excel):

Выбираем «Гистограмма»:

Задаем входной интервал (столбец с числовыми значениями). Поле «Интервалы карманов» оставляем пустым: Excel сгенерирует автоматически. Ставим птичку около записи «Вывод графика»:

После нажатия ОК получаем такой график с таблицей:

В интервалах не очень много значений, поэтому столбики гистограммы получились низкими.

Теперь необходимо сделать так, чтобы по вертикальной оси отображались относительные частоты.

Найдем сумму всех абсолютных частот (с помощью функции СУММ). Сделаем дополнительный столбец «Относительная частота». В первую ячейку введем формулу:

Способ второй. Вернемся к таблице с исходными данными. Вычислим интервалы карманов. Сначала найдем максимальное значение в диапазоне температур и минимальное.

Чтобы найти интервал карманов, нужно разность максимального и минимального значений массива разделить на количество интервалов. Получим «ширину кармана».

Представим интервалы карманов в виде столбца значений. Сначала ширину кармана прибавляем к минимальному значению массива данных. В следующей ячейке – к полученной сумме. И так далее, пока не дойдем до максимального значения.

Для определения частоты делаем столбец рядом с интервалами карманов. Вводим функцию массива:

Вычислим относительные частоты (как в предыдущем способе).

Построим столбчатую диаграмму распределения осадков в Excel с помощью стандартного инструмента «Диаграммы».

Частота распределения заданных значений:

Таблица нормального распределения

Таблицы нормального распределения встречаются двух типов:

— таблица плотности;

— таблица функции (интеграла от плотности).

Таблица плотности используется редко. Тем не менее, посмотрим, как она выглядит. Допустим, нужно получить плотность для z = 1, т.е. плотность значения, отстоящего от матожидания на 1 сигму. Ниже показан кусок таблицы.

В зависимости от организации данных ищем нужное значение по названию столбца и строки. В нашем примере берем строку 1,0 и столбец , т.к. сотых долей нет. Искомое значение равно 0,2420 (0 перед 2420 опущен).

Функция Гаусса симметрична относительно оси ординат. Поэтому φ(z)= φ(-z), т.е. плотность для 1 тождественна плотности для -1, что отчетливо видно на рисунке.

Чтобы не тратить зря бумагу, таблицы печатают только для положительных значений.

На практике чаще используют значения функции стандартного нормального распределения, то есть вероятности для различных z.

В таких таблицах также содержатся только положительные значения. Поэтому для понимания и нахождения любых нужных вероятностей следует знать свойства стандартного нормального распределения.

Функция Ф(z) симметрична относительно своего значения 0,5 (а не оси ординат, как плотность). Отсюда справедливо равенство:

Это факт показан на картинке:

Значения функции Ф(-z) и Ф(z) делят график на 3 части. Причем верхняя и нижняя части равны (обозначены галочками). Для того, чтобы дополнить вероятность Ф(z) до 1, достаточно добавить недостающую величину Ф(-z). Получится равенство, указанное чуть выше.

Если нужно отыскать вероятность попадания в интервал (0; z), то есть вероятность отклонения от нуля в положительную сторону до некоторого количества стандартных отклонений, достаточно от значения функции стандартного нормального распределения отнять 0,5:

Для наглядности можно взглянуть на рисунок.

На кривой Гаусса, эта же ситуация выглядит как площадь от центра вправо до z.

Довольно часто аналитика интересует вероятность отклонения в обе стороны от нуля. А так как функция симметрична относительно центра, предыдущую формулу нужно умножить на 2:

Под кривой Гаусса это центральная часть, ограниченная выбранным значением –z слева и z справа.

Указанные свойства следует принять во внимание, т.к. табличные значения редко соответствуют интересующему интервалу

Для облегчения задачи в учебниках обычно публикуют таблицы для функции вида:

Если нужна вероятность отклонения в обе стороны от нуля, то, как мы только что убедились, табличное значение для данной функции просто умножается на 2.

Теперь посмотрим на конкретные примеры. Ниже показана таблица стандартного нормального распределения. Найдем табличные значения для трех z: 1,64, 1,96 и 3.

Как понять смысл этих чисел? Начнем с z=1,64, для которого табличное значение составляет 0,4495. Проще всего пояснить смысл на рисунке.

То есть вероятность того, что стандартизованная нормально распределенная случайная величина попадет в интервал от до 1,64, равна 0,4495. При решении задач обычно нужно рассчитать вероятность отклонения в обе стороны, поэтому умножим величину 0,4495 на 2 и получим примерно 0,9. Занимаемая площадь под кривой Гаусса показана ниже.

Таким образом, 90% всех нормально распределенных значений попадает в интервал ±1,64σ от средней арифметической. Я не случайно выбрал значение z=1,64, т.к. окрестность вокруг средней арифметической, занимающая 90% всей площади, иногда используется для проверки статистических гипотез и расчета доверительных интервалов. Если проверяемое значение не попадает в обозначенную область, то его наступление маловероятно (всего 10%).

Для проверки гипотез, однако, чаще используется интервал, накрывающий 95% всех значений. Половина вероятности от 0,95 – это 0,4750 (см. второе выделенное в таблице значение).

Для этой вероятности z=1,96. Т.е. в пределах почти ±2σ от средней находится 95% значений. Только 5% выпадают за эти пределы.

Еще одно интересное и часто используемое табличное значение соответствует z=3, оно равно по нашей таблице 0,4986. Умножим на 2 и получим 0,997. Значит, в рамках ±3σ от средней арифметической заключены почти все значения.

Так выглядит правило 3 сигм для нормального распределения на диаграмме.

С помощью статистических таблиц можно получить любую вероятность. Однако этот метод очень медленный, неудобный и сильно устарел. Сегодня все делается на компьютере. Далее переходим к практике расчетов в Excel.

Понравилась статья? Поделиться с друзьями:
Самоучитель Брин Гвелл
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: