Распределение пуассона и формула пуассона

Нормальное распределение (гаусса) в excel - statanaliz.info

Задача

Типичным применением Распределения Пуассона
в контроле качества является модель количества дефектов, которые могут появиться в приборе или устройстве.

Например, при среднем количестве дефектов в микросхеме λ (лямбда) равном 4, вероятность, что случайно выбранная микросхема будет иметь 2 или меньше дефектов, равна: =ПУАССОН.РАСП(2;4;ИСТИНА)=0,2381

Третий параметр в функции установлен = ИСТИНА, поэтому функция вернет интегральную функцию распределения
, то есть вероятность того, что число случайных событий окажется в диапазоне от 0 до 4 включительно.

Вычисления в этом случае производятся по формуле:

Вероятность того, что случайно выбранная микросхема будет иметь ровно 2 дефекта, равна: =ПУАССОН.РАСП(2;4;ЛОЖЬ)=0,1465

Третий параметр в функции установлен = ЛОЖЬ, поэтому функция вернет плотность вероятности.

Вероятность того, что случайно выбранная микросхема будет иметь больше 2-х дефектов, равна: =1-ПУАССОН.РАСП(2;4;ИСТИНА) =0,8535

Примечание
: Если x
не является целым числом, то при вычислении формулы . Формулы =ПУАССОН.РАСП(2
; 4; ЛОЖЬ)
и =ПУАССОН.РАСП(2,9
; 4; ЛОЖЬ)
вернут одинаковый результат.

Условия возникновения распределения Пуассона

Рассмотрим условия, при которых возникает распределение Пуассона.

Во-первых, распределение Пуассона является предельным для биномиального распределения

,
когда число опытов n
неограниченно увеличивается (стремится к бесконечности) и одновременно
вероятность p
успеха в одном опыте неограниченно уменьшается (стремится к нулю), но так, что
их произведение np
сохраняется в пределе постоянным и равным λ

(лямбде):

В математическом анализе доказано, что распределение Пуассона с параметром
λ
= np

можно приближенно применять вместо
биномиального, когда число опытов n
очень велико, а вероятность p
очень мала, то есть
в каждом отдельном опыте событие A
появляется крайне редко.

Во-вторых, распределение Пуассона имеет место, когда есть поток событий, называемым простейшим
(или стационарным пуассоновским потоком)

. Потоком событий называют последовательность таких моментов,
как поступление вызовов на коммуникационный узел, приходы посетителей в магазин, прибытие составов на
сортировочную горку и тому подобных. Пуассоновский поток обладает следующими свойствами:

  • стационарность: вероятность наступления m
    событий в определённый период времени постоянна
    и не зависит от начала отсчёта времени, а зависит только от длины участка времени;
  • ординарность: вероятность попадания на малый участок времени двух или более событий
    пренебрежимо мала по сравнению с вероятностью попадания на него одного события;
  • отсутствие последствия: вероятность наступления m
    событий в определённый период времени не зависит
    от того, сколько событий наступило в предыдущий период.

Что такое распределение Пуассона?

Прежде чем вводить параметр λ и подставлять его в формулу, давайте задумаемся: почему Пуассону вообще пришлось изобретать такое распределение?

1. Почему Пуассон изобрел свое распределение?

Чтобы предсказывать количествобудущихсобытий!

Или более формально: чтобы предсказывать вероятность данного числа событий, происходящих в определенный интервал времени.

В продажах, например, “событие” это покупка (сам момент покупки, не просто выбор). Событием может быть количество посетителей в день на веб-сайте, кликов на рекламном объявлении в следующем месяце, число звонков в рабочее время или число людей, которые умрут от смертельных заболеваний в следующем году, и так далее.

Вот пример, как я использую распределение Пуассона в реальной жизни.

Каждую неделю в среднем 17 человек оставляют лайк под моим постом в блоге. Я хочу предсказать количество лайков на следующей неделе, потому что мои еженедельные выплаты зависят от этого количества. Какова вероятность того, что точно 20 человек (или 10, 30, 50 и так далее) поставят лайк под моим постом на следующей неделе?

2. Как решить эту задачу?

Давайте на время сделаем вид, что мы ничего не знаем о распределении Пуассона. Как тогда решить задачу?

Первый путь: начать с количества прочтений. Для каждого читателя блога есть вероятность, что статья ему действительно понравится и он поставит лайк.

Это классическая работа для биномиального распределения, так как мы рассчитываем количество успешных событий (лайков).

Биномиальная случайная величина — это количество успешных x в n повторяющихся попыток. Предполагается, что вероятность успеха p является постоянной в каждой попытке.

Итак, у нас есть только один параметр  — 17 человек в неделю, что является “средним значением” (средним значением успешных событий в неделею, или математическим ожиданием x). Нам ничего не известно ни о вероятности получения лайков p, ни о количестве посетителей блога n.

Значит, нам нужно больше информации для решения задачи. Что конкретно нужно, чтобы оформить эту вероятность как биномиальную проблему? Две вещи: вероятность успеха (лайков) p и количество попыток (посетителей) n.

Получим их из прошлых данных.

Это статистика за 1 год. Общее количество читателей блога — 59 тысяч, 888 из них поставили лайк. 

Следовательно, количество читателей в неделю (n): 59 000/52 = 1134. Количество поставивших лайк в неделю (x): 888/52 =17.

количество читателей в неделю (n) = 59000/52 = 1134 количество оставивших лайк в неделю (x) = 888/52 = 17 вероятность успеха (p) : 888/59000 = 0.015 = 1.5%

Используя биномиальную функцию вероятности, посчитаем вероятность того, что я получу точно 20 успешных событий (20 лайков) на следующей неделе.

╔══════╦═══════════════════╗║ x ║ Binomial P(X=x) ║╠══════╬═══════════════════╣║ 10 ║ 0.02250 ║║ 17 ║ 0.09701 ║

Как это работает?

Краткий ответ: Формулы, динамические именованные диапазоны, элемент управления «Полоса прокрутки» в сочетании с гистограммой.

Формулы

Чтобы всё работало, первым делом нужно при помощи формул вычислить размер группы и количество элементов в каждой группе.

Чтобы вычислить размер группы, разделим общее количество (80-10) на количество групп. Количество групп устанавливается настройками полосы прокрутки. Чуть позже разъясним это подробнее.

Далее при помощи функции ЧАСТОТА (FREQUENCY) я рассчитываю количество элементов в каждой группе в заданном столбце. В данном случае мы возвращаем частоту из столбца Age таблицы с именем tblData.

Функция ЧАСТОТА (FREQUENCY) вводится, как формула массива, нажатием Ctrl+Shift+Enter.

Динамический именованный диапазон

В качестве источника данных для диаграммы используется именованный диапазон, чтобы извлекать данные только из выбранных в текущий момент групп.

Когда пользователь перемещает ползунок полосы прокрутки, число строк в динамическом диапазоне изменяется так, чтобы отобразить на графике только нужные данные. В нашем примере задано два динамических именованных диапазона: один для данных — rngGroups (столбец Frequency) и второй для подписей горизонтальной оси — rngCount (столбец Bin Name).

Элемент управления «Полоса прокрутки»

Элемент управления Полоса прокрутки (Scroll Bar) может быть вставлен с вкладки Разработчик (Developer).

На рисунке ниже видно, как я настроил параметры элемента управления и привязал его к ячейке C7. Так, изменяя состояние полосы прокрутки, пользователь управляет формулами.

Гистограмма

График – это самая простая часть задачи. Создаём простую гистограмму и в качестве источника данных устанавливаем динамические именованные диапазоны.

Круговые диаграммы для иллюстрации распределения

С помощью круговой диаграммы можно иллюстрировать данные, которые находятся в одном столбце или одной строке. Сегмент круга – это доля каждого элемента массива в сумме всех элементов.

С помощью любой круговой диаграммы можно показать распределение в том случае, если

  • имеется только один ряд данных;
  • все значения положительные;
  • практически все значения выше нуля;
  • не более семи категорий;
  • каждая категория соответствует сегменту круга.

На основании имеющихся данных о количестве осадков построим круговую диаграмму.

Доля «каждого месяца» в общем количестве осадков за год:

Круговая диаграмма распределения осадков по сезонам года лучше смотрится, если данных меньше. Найдем среднее количество осадков в каждом сезоне, используя функцию СРЗНАЧ. На основании полученных данных построим диаграмму:

Получили количество выпавших осадков в процентном выражении по сезонам.

В двух словах: Добавляем полосу прокрутки к гистограмме или к графику распределения частот, чтобы сделать её динамической или интерактивной.

Уровень сложности: продвинутый.

На следующем рисунке показано, как выглядит готовая динамическая гистограмма:

Биномиальное распределение

Пусть имеется некое событие
A
.
Вероятность появления события
A

равна
p

,
вероятность непоявления события
A

равна
1 p

,
иногда ее обозначают как
q

.
Пусть
n

число испытаний,
m

частота появления события
A

в этих
n

испытаниях.

Известно, что суммарная вероятность всех возможных комбинаций исходов равна
единице, то есть:

1 = p
n
+ n
· p
n
1 · (1 p
) + C
n
n
2 · p
n
2 · (1 p
) 2 + + C
n
m
· p
m
· (1 p
) n
m
+ + (1 p
) n

.

p
n

вероятность того, что в
n
n

раз;

n
· p
n
1 · (1 p
)

вероятность того, что в
n
n
1)

раз и не произойдет 1 раз;

C
n
n
2 · p
n
2 · (1 p
) 2

вероятность того, что в
n

испытаниях
событие
A

произойдет
(n
2)

раза и не произойдет 2 раза;

P
m
= C
n
m
· p
m
· (1 p
) n
m

вероятность того, что в
n

испытаниях событие
A

произойдет
m

раз и не произойдет
(n
m
)

раз;

(1 p
) n

вероятность того, что в
n

испытаниях
событие
A

не произойдет ни разу;

число сочетаний из
n

по
m

.

Математическое ожидание
M

биномиального распределения равно:

M
= n
· p

,

где
n

число испытаний,
p

вероятность появления события
A
.

Среднеквадратичное отклонение
σ

:

σ
= sqrt(n
· p
· (1 p
))
.

Пример 1
.
Вычислить вероятность того, что событие,
имеющее вероятность
p
= 0.5
,
в
n
= 10

испытаниях произойдет
m
= 1

раз. Имеем:
C
10 1 = 10
,
и далее:
P
1 = 10 · 0.5 1 · (1 0.5) 10 1 = 10 · 0.5 10 = 0.0098
.
Как видим, вероятность наступления этого события достаточно мала. Объясняется это,
во-первых, тем, что абсолютно не ясно, произойдет ли событие или нет, поскольку
вероятность равна 0.5 и шансы здесь «50 на 50»; а во-вторых, требуется
исчислить то, что событие произойдет именно один раз (не больше и не меньше) из десяти.

Пример 2
.
Вычислить вероятность того, что событие,
имеющее вероятность
p
= 0.5
,
в
n
= 10

испытаниях произойдет
m
= 2

раза. Имеем:
C
10 2 = 45
,
и далее:
P
2 = 45 · 0.5 2 · (1 0.5) 10 2 = 45 · 0.5 10 = 0.044
.
Вероятность наступления этого события стала больше!

Пример 3
.
Увеличим вероятность наступления самого события. Сделаем его более вероятным.
Вычислить вероятность того, что событие, имеющее вероятность
p
= 0.8
,
в
n
= 10

испытаниях произойдет
m
= 1

раз. Имеем:
C
10 1 = 10
,
и далее:
P
1 = 10 · 0.8 1 · (1 0.8) 10 1 = 10 · 0.8 1 · 0.2 9 = 0.000004
.
Вероятность стала меньше, чем в первом примере! Ответ, на первый взгляд,
кажется странным, но поскольку событие имеет достаточно большую вероятность,
вряд ли оно произойдет только один раз. Более вероятно, что оно произойдет
большее, чем один, количество раз. Действительно, подсчитывая
P
0
,
P
1
,
P
2
,
P
3
,
,
P
10

(вероятность того, что событие в
n
= 10

испытаниях произойдет 0, 1, 2, 3, , 10 раз), мы увидим:

C
10 0 = 1
,
C
10 1 = 10
,
C
10 2 = 45
,
C
10 3 = 120
,
C
10 4 = 210
,
C
10 5 = 252
,
C
10 6 = 210
,
C
10 7 = 120
,
C
10 8 = 45
,
C
10 9 = 10
,
C
10 10 = 1
;

P
0 = 1 · 0.8 0 · (1 0.8) 10 0 = 1 · 1 · 0.2 10 = 0.0000
;
P
1 = 10 · 0.8 1 · (1 0.8) 10 1 = 10 · 0.8 1 · 0.2 9 = 0.0000
;
P
2 = 45 · 0.8 2 · (1 0.8) 10 2 = 45 · 0.8 2 · 0.2 8 = 0.0000
;
P
3 = 120 · 0.8 3 · (1 0.8) 10 3 = 120 · 0.8 3 · 0.2 7 = 0.0008
;
P
4 = 210 · 0.8 4 · (1 0.8) 10 4 = 210 · 0.8 4 · 0.2 6 = 0.0055
;
P
5 = 252 · 0.8 5 · (1 0.8) 10 5 = 252 · 0.8 5 · 0.2 5 = 0.0264
;
P
6 = 210 · 0.8 6 · (1 0.8) 10 6 = 210 · 0.8 6 · 0.2 4 = 0.0881
;
P
7 = 120 · 0.8 7 · (1 0.8) 10 7 = 120 · 0.8 7 · 0.2 3 = 0.2013
;
P
8 = 45 · 0.8 8 · (1 0.8) 10 8 = 45 · 0.8 8 · 0.2 2 = 0.3020
(самая большая вероятность!);
P
9 = 10 · 0.8 9 · (1 0.8) 10 9 = 10 · 0.8 9 · 0.2 1 = 0.2684
;
P
10 = 1 · 0.8 10 · (1 0.8) 10 10 = 1 · 0.8 10 · 0.2 0 = 0.1074

Разумеется,
P
0 + P
1 + P
2 + P
3 + P
4 + P
5 + P
6 + P
7 + P
8 + P
9 + P
10 = 1
.

Числовые характеристики случайной величины Х

Математическое ожидание распределения Пуассона M = λ

Дисперсия распределения Пуассона D = λ

Пример №1. Семена содержат 0.1% сорняков. Какова вероятность при случайном отборе 2000 семян обнаружить 5 семян сорняков? Решение. Вероятность р мала, а число n велико. np = 2 P(5) = λ5e-5/5! = 0.03609 Математическое ожидание: M = λ = 2 Дисперсия: D = λ = 2

Пример №2. Среди семян ржи имеется 0.4% семян сорняков. Составить закон распределения числа сорняков при случайном отборе 5000 семян. Найти математическое ожидание и дисперсию этой случайной величины. Решение. Математическое ожидание: M = λ = 0.004*5000 = 20. Дисперсия: D = λ = 20 Закон распределения:

X 1 2 m
P e-20 20e-20 200e-20 20me-20/m!

Пример №3. На телефонной станции неправильное соединение происходит с вероятностью 1/200. Найдите вероятность того, что среди 200 соединений произойдет: а) ровно одно неправильное соединение; б) меньше чем три неправильных соединения; в) больше чем два неправильных соединения. Решение. По условию задачи вероятность события мала, поэтому используем формулу Пуассона (15). а) Задано: n = 200, p = 1/200, k = 1. Найдем P200(1). Получаем: . Тогда P200(1) ≈ e-1≈ 0,3679. б) Задано: n = 200, p = 1/200, k 2. Найдем P200(k > 2)

Эту задачу можно решить проще: найти вероятность противоположного события, так как в этом случае нужно вычислить меньше слагаемых. Принимая во внимание предыдущий случай, имеем Рассмотрим случай, когда n является достаточно большим, а p — достаточно малым; положим np = a, где a — некоторое число

В этом случае искомая вероятность определяется формулой Пуассона:

Вероятность появления k событий за время длительностью t можно также найти по формуле Пуассона:

где λ — интенсивность потока событий, то есть среднее число событий, которые появляются в единицу времени.

Пример №4. Вероятность того, что деталь бракованная, равна 0.005. проверяется 400 деталей. Укажите формулу вычисления вероятности того, что больше 3 деталей оказались с браком.

Пример №5. Вероятность появления бракованных деталей при их массовом производстве равна p. определить вероятность того, что в партии из N деталей содержится а) ровно три детали; б) не более трех бракованных деталей. p=0,001; N = 4500 Решение. Вероятность р мала, а число n велико. np = 4.5 < 10. Значит случайная величина Х – распределена по Пуассоновскому распределению. Составим закон. Случайная величина X имеет область значений (0,1,2,…,m). Вероятности этих значений можно найти по формуле: Найдем ряд распределения X. Здесь λ = np = 4500*0.001 = 4.5 P(0) = e– λ = e-4.5 = 0.01111 P(1) = λe-λ = 4.5e-4.5 = 0.04999 Найдем ряд распределения X. Здесь λ = np = 4500*0.001 = 4.5 P(0) = e– λ = e-4.5 = 0.01111 P(1) = λe-λ = 4.5e-4.5 = 0.04999 Тогда вероятность того, что в партии из N деталей содержится ровно три детали, равна: Тогда вероятность того, что в партии из N деталей содержится не более трех бракованных деталей: P(x<3) = P(0) + P(1) + P(2) = 0,01111 + 0,04999 + 0,1125 = 0,1736

Пример №6. Автоматическая телефонная станция получает в среднем за час N вызовов. Определить вероятность того, что за данную минуту она получит: а) ровно два вызова; б) более двух вызовов. N = 18 Решение. За одну минуту АТС в среднем получает λ = 18/60 мин. = 0,3 Считая, что случайное число X вызовов, поступивших на АТС за одну минуту, подчиняется закону Пуассона, по формуле найдем искомую вероятность Найдем ряд распределения X. Здесь λ = 0.3 P(0) = e– λ = e-0.3 = 0.7408 P(1) = λe-λ = 0.3e-0.3 = 0.2222 Найдем ряд распределения X. Здесь λ = 0.3 P(0) = e– λ = e-0.3 = 0.7408 P(1) = λe-λ = 0.3e-0.3 = 0.2222 Вероятность того, что за данную минуту она получит ровно два вызова: P(2) = 0,03334 Вероятность того, что за данную минуту она получит более двух вызовов: P(x>2) = 1 – 0,7408 – 0,2222 – 0,03334 = 0,00366

Пример №7. Рассматриваются два элемента, работающих независимо друг от друга. Продолжительность времени безотказной работы имеет показательное распределение с параметром λ1 = 0,02 для первого элемента и λ2 = 0,05 для второго элемента. Найти вероятность того, что за 10 часов: а) оба элемента будут работать безотказно; б) только Вероятность того, что за 10 часов элемент №1 не выйдет из строя: Рещение. P1(0) = e-λ1*t = e-0.02*10 = 0,8187

Вероятность того, что за 10 часов элемент №2 не выйдет из строя: P2(0) = e-λ2*t = e-0.05*10 = 0,6065

а) оба элемента будут работать безотказно; P(2) = P1(0)*P2(0) = 0,8187*0,6065 = 0,4966 б) только один элемент выйдет из строя. P(1) = P1(0)*(1-P2(0)) + (1-P1(0))*P2(0) = 0.8187*(1-0.6065) + (1-0.8187)*0.6065 = 0.4321

Пример №7. Производство даёт 1% брака. Какова вероятность того, что из взятых на исследование 1100 изделий выбраковано будет не больше 17? Примечание: поскольку здесь n*p=1100*0.01=11 > 10, то необходимо использовать теорему Лапласа.

Задача

Типичным применением Распределения Пуассона
в контроле качества является модель количества дефектов, которые могут появиться в приборе или устройстве.

Например, при среднем количестве дефектов в микросхеме λ (лямбда) равном 4, вероятность, что случайно выбранная микросхема будет иметь 2 или меньше дефектов, равна: =ПУАССОН.РАСП(2;4;ИСТИНА)=0,2381

Третий параметр в функции установлен = ИСТИНА, поэтому функция вернет интегральную функцию распределения
, то есть вероятность того, что число случайных событий окажется в диапазоне от 0 до 4 включительно.

Вычисления в этом случае производятся по формуле:

Вероятность того, что случайно выбранная микросхема будет иметь ровно 2 дефекта, равна: =ПУАССОН.РАСП(2;4;ЛОЖЬ)=0,1465

Третий параметр в функции установлен = ЛОЖЬ, поэтому функция вернет плотность вероятности.

Вероятность того, что случайно выбранная микросхема будет иметь больше 2-х дефектов, равна: =1-ПУАССОН.РАСП(2;4;ИСТИНА) =0,8535

Примечание
: Если x
не является целым числом, то при вычислении формулы . Формулы =ПУАССОН.РАСП(2
; 4; ЛОЖЬ)
и =ПУАССОН.РАСП(2,9
; 4; ЛОЖЬ)
вернут одинаковый результат.

Таблица нормального распределения

Таблицы нормального распределения встречаются двух типов:

— таблица плотности;

— таблица функции (интеграла от плотности).

Таблица плотности используется редко. Тем не менее, посмотрим, как она выглядит. Допустим, нужно получить плотность для z = 1, т.е. плотность значения, отстоящего от матожидания на 1 сигму. Ниже показан кусок таблицы. 

В зависимости от организации данных ищем нужное значение по названию столбца и строки. В нашем примере берем строку 1,0 и столбец , т.к. сотых долей нет. Искомое значение равно 0,2420 (0 перед 2420 опущен). 

Функция Гаусса симметрична относительно оси ординат. Поэтому φ(z)= φ(-z), т.е. плотность для 1 тождественна плотности для -1, что отчетливо видно на рисунке.

Чтобы не тратить зря бумагу, таблицы печатают только для положительных значений.

На практике чаще используют значения функции стандартного нормального распределения, то есть вероятности для различных z.

В таких таблицах также содержатся только положительные значения. Поэтому для понимания и нахождения любых нужных вероятностей следует знать свойства стандартного нормального распределения.

Функция Ф(z) симметрична относительно своего значения 0,5 (а не оси ординат, как плотность). Отсюда справедливо равенство:

Это факт показан на картинке:

Значения функции Ф(-z) и Ф(z) делят график на 3 части. Причем верхняя и нижняя части равны (обозначены галочками). Для того, чтобы дополнить вероятность Ф(z) до 1, достаточно добавить недостающую величину Ф(-z). Получится равенство, указанное чуть выше.

Если нужно отыскать вероятность попадания в интервал (0; z), то есть вероятность отклонения от нуля в положительную сторону до некоторого количества стандартных отклонений, достаточно от значения функции стандартного нормального распределения отнять 0,5:

Для наглядности можно взглянуть на рисунок.

На кривой Гаусса, эта же ситуация выглядит как площадь от центра вправо до z.

Довольно часто аналитика интересует вероятность отклонения в обе стороны от нуля. А так как функция симметрична относительно центра, предыдущую формулу нужно умножить на 2:

Рисунок ниже.

Под кривой Гаусса это центральная часть, ограниченная выбранным значением –z слева и z справа.

Указанные свойства следует принять во внимание, т.к. табличные значения редко соответствуют интересующему интервалу

Для облегчения задачи в учебниках обычно публикуют таблицы для функции вида:

Если нужна вероятность отклонения в обе стороны от нуля, то, как мы только что убедились, табличное значение для данной функции просто умножается на 2.

Теперь посмотрим на конкретные примеры. Ниже показана таблица стандартного нормального распределения. Найдем табличные значения для трех z: 1,64, 1,96 и 3.

Как понять смысл этих чисел? Начнем с z=1,64, для которого табличное значение составляет 0,4495. Проще всего пояснить смысл на рисунке.

То есть вероятность того, что стандартизованная нормально распределенная случайная величина попадет в интервал от до 1,64, равна 0,4495. При решении задач обычно нужно рассчитать вероятность отклонения в обе стороны, поэтому умножим величину 0,4495 на 2 и получим примерно 0,9. Занимаемая площадь под кривой Гаусса показана ниже.

Таким образом, 90% всех нормально распределенных значений попадает в интервал ±1,64σ от средней арифметической. Я не случайно выбрал значение z=1,64, т.к. окрестность вокруг средней арифметической, занимающая 90% всей площади, иногда используется для проверки статистических гипотез и расчета доверительных интервалов. Если проверяемое значение не попадает в обозначенную область, то его наступление маловероятно (всего 10%).

Для проверки гипотез, однако, чаще используется интервал, накрывающий 95% всех значений. Половина вероятности от 0,95 – это 0,4750 (см. второе выделенное в таблице значение).

Для этой вероятности z=1,96. Т.е. в пределах почти ±2σ от средней находится 95% значений. Только 5% выпадают за эти пределы.

Еще одно интересное и часто используемое табличное значение соответствует z=3, оно равно по нашей таблице 0,4986. Умножим на 2 и получим 0,997. Значит, в рамках ±3σ от средней арифметической заключены почти все значения.

Так выглядит правило 3 сигм для нормального распределения на диаграмме.

С помощью статистических таблиц можно получить любую вероятность. Однако этот метод очень медленный, неудобный и сильно устарел. Сегодня все делается на компьютере. Далее переходим к практике расчетов в Excel.

Распределение Пуассона дискретных случайных величин

Дискретнаяслучайная величина распределена позакону Пуассона, если она принимаетзначения 0,1,2…mn…,бесконечное, но счетное число раз, свероятностями, определяемыми по формулеПуассона:

где,p.

Законраспределения примет вид:

1 2 m

,

ит.д.

Теорема.Математическоеожидание и дисперсия случайной величины,распределенной по закону Пуассона, равны параметру Пуассона.

Пример1.

Станокизготавливает за смену 100000 деталей.Вероятность изготовления бракованнойдетали p= 0,0001.

Найтивероятность того, что за смену будетизготовлено 5 бракованных деталей.

Решение:

Обозначим n= 100 000,k= 5, p= 0,0001. События, состоящие в том, чтоотдельная деталь бракована, независимы,число испытаний nвелико, а вероятность pмала, поэтому воспользуемся распределениемПуассона:

где

Пример2.

Устройствосостоит из 1000 элементов. Вероятностьотказа любого элемента в течение времениt равна 0,002.

Найтиматематическое ожидание, дисперсию, среднее квадратическое отклонениеимоду.

Решение:

X‒ случайная величина ‒ число отказавшихза время tэлементов.

,.Следовательно, случайная величинараспределена по закону Пуассона.

элемента

Составимзакон распределения Пуассона:

1 2 3 m
0,135335 0,270671 0,270671 0,180447

ит.д.

Непрерывнойслучайной величинойназывают случайную величину, значениякоторой сплошь заполняют некоторыйинтервал.

Например,рост человека ‒ непрерывная случайнаявеличина.

Функциейраспределения случайной величины называют вероятность того, что случайнаявеличина Хпринимает значения, меньшие х.

F(x)= P(X

Геометрически,формула F(x)= P(Xозначает,что все значения Хбудут находиться, левее х.Функция F(x)называется интегральной функцией.

Плотностьювероятности непрерывнойслучайной величины f(x)называется производная от функциираспределения этой случайной величины:

Следовательно, F(x)первообразная для f(x).

Теорема.Вероятность попадания непрерывнойслучайной величины Xв интервал от aдо bнаходится по формуле:

Доказательство.

Следствие.Если все возможные значения случайной величины

10. Математическое ожидание и дисперсия непрерывной случайной величины

1.Математическое ожидание:

2.Дисперсия:

Преобразуемэту формулу:

‒формуладисперсии для непрерывных случайныхвеличин.

Тогдасреднее квадратическое отклонение:

1.Нормальный закон распределения

Извсех законов распределения для непрерывныхслучайных величин на практике чащевсего встречается нормальныйзаконраспределения. Этот закон распределенияявляется предельным, то есть все остальныераспределения стремятся к нормальному.

Теорема1. Непрерывнаяслучайная величина распределена понормальномузакону спараметрами аи ,еслиплотность вероятности имеет вид:

Математическоеожидание случайной величины, распределённойпо нормальному закону распределения,равно а,то естьдисперсия.

Теорема2. Вероятностьпопадания непрерывной случайнойвеличины, распределенной по нормальномузакону распределения в интервал от αдо β,находится по формуле:

Пример.

Полагая,что рост мужчин определенной возрастнойгруппы есть нормально распределеннаяслучайная величина  X, c параметрами а =173 и =36.

Найти:а)выражение плотности вероятностей ифункции распределения случайнойвеличины X;

б)долю костюмов 4-го роста (176 – 182 см) вобщем объеме производства.

Решение:

Плотностьвероятности нормально распределеннойслучайной величины:

0,2417100%24,2%‒ доля костюмов 4-го роста в общем объемепроизводства.

Итак,функция плотности вероятностейнормального закона распределения имеетвид:

Тогдафункция распределения:

Распределение Пуассона

Распределение Пуассона это частный случай биномиального распределения
(при
n
>> 0

и при
p
> 0

(редкие события)).

Из математики известна формула, позволяющая примерно подсчитать значение любого
члена биномиального распределения:

где
a
= n
· p

параметр Пуассона (математическое ожидание), а дисперсия равна
математическому ожиданию. Приведем математические выкладки, поясняющие этот переход.
Биномиальный закон распределения

P
m
= C
n
m
· p
m
· (1 p
) n
m

может быть написан, если положить
p
= a
/n

,
в виде

Так как
p

очень мало, то следует принимать во внимание только числа
m

,
малые по сравнению с
n

.
Произведение

весьма близко к единице. Это же относится к величине

Величина

очень близка к
e
a

.
Отсюда получаем формулу:

Пример
.
В ящике находится
n
= 100

деталей, как качественных, так и бракованных. Вероятность достать бракованное
изделие составляет
p
= 0.01
.
Допустим, что мы вынимаем изделие, определяем, бракованное оно или нет,
и кладем его обратно. Поступая таким образом, получилось, что из 100 изделий,
которые мы перебрали, два оказались бракованными. Какова вероятность этого?

По биномиальному распределению получаем:

По распределению Пуассона получаем:

Как видно, величины получились близкими, поэтому в случае редких событий
вполне допустимо применять закон Пуассона, тем более что он требует
меньших вычислительных затрат.

Покажем графически вид закона Пуассона. Возьмем для примера параметры
p
= 0.05
,
n
= 10
.
Тогда:

C
10 0 = 1
,
C
10 1 = 10
,
C
10 2 = 45
,
C
10 3 = 120
,
C
10 4 = 210
,
C
10 5 = 252
,
C
10 6 = 210
,
C
10 7 = 120
,
C
10 8 = 45
,
C
10 9 = 10
,
C
10 10 = 1
;

P
0 = 1 · 0.05 0 · (1 0.05) 10 0 = 1 · 1 · 0.95 10 = 0.5987
;
P
1 = 10 · 0.05 1 · (1 0.05) 10 1 = 10 · 0.05 1 · 0.95 9 = 0.3151
;
P
2 = 45 · 0.05 2 · (1 0.05) 10 2 = 45 · 0.05 2 · 0.95 8 = 0.0746
;
P
3 = 120 · 0.05 3 · (1 0.05) 10 3 = 120 · 0.05 3 · 0.95 7 = 0.0105
;
P
4 = 210 · 0.05 4 · (1 0.05) 10 4 = 210 · 0.05 4 · 0.95 6 = 0.00096
;
P
5 = 252 · 0.05 5 · (1 0.05) 10 5 = 252 · 0.05 5 · 0.95 5 = 0.00006
;
P
6 = 210 · 0.05 6 · (1 0.05) 10 6 = 210 · 0.05 6 · 0.95 4 = 0.0000
;
P
7 = 120 · 0.05 7 · (1 0.05) 10 7 = 120 · 0.05 7 · 0.95 3 = 0.0000
;
P
8 = 45 · 0.05 8 · (1 0.05) 10 8 = 45 · 0.05 8 · 0.95 2 = 0.0000
;
P
9 = 10 · 0.05 9 · (1 0.05) 10 9 = 10 · 0.05 9 · 0.95 1 = 0.0000
;
P
10 = 1 · 0.05 10 · (1 0.05) 10 10 = 1 · 0.05 10 · 0.95 0 = 0.0000

Разумеется,
P
0 + P
1 + P
2 + P
3 + P
4 + P
5 + P
6 + P
7 + P
8 + P
9 + P
10 = 1
.

Рис. 27.3. График распределения Пуассона при p = 0.05 и n = 10

При
n
> ∞

распределение Пуассона переходит в нормальный закон, согласно центральной
предельной теореме (см.

Решение задачи на распределение Пуассона в Excel

Пример 1. Отдел технического контроля определил, что среднее число не соблюденных допусков в размерах производимых деталей составляет 6. Определить вероятности следующих событий обеими рассматриваемыми функциями (для сравнения результатов вычислений):

  1. Вероятность наличия 3 и менее погрешностей в случайно отобранной детали.
  2. Вероятность наличия ровно 3 погрешностей в случайно выбранной детали.

Вид таблицы данных:

Рассчитаем вероятность наличия трех и менее дефектов с помощью функций:

  • B3 – среднее значение;
  • B2 – предполагаемое значение, для которого рассчитывается вероятность;
  • ИСТИНА – указатель на интегральный тип функции.

Для нахождения вероятности выбора детали с наличием ровно трех дефектов используем функции:

Для расчета вероятности точного совпадения третий аргумент задан в качестве логического ЛОЖЬ.

Как видно, результаты вычислений обеих функций идентичны.

Распределение Пуассона в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Распределения Пуассона имеется функция ПУАССОН.РАСП() , английское название — POISSON.DIST(), которая позволяет вычислить не только вероятность того, что за заданный период времени произойдет х событий (функцию плотности вероятности p(x), см. формулу выше), но и интегральную функцию распределения (вероятность того, что за заданный период времени произойдет не меньше x событий).

До MS EXCEL 2010 в EXCEL была функция ПУАССОН() , которая также позволяет вычислить функцию распределения и плотность вероятности p(x). ПУАССОН() оставлена в MS EXCEL 2010 для совместимости.

В файле примера приведены графики плотности распределения вероятности и интегральной функции распределения .

Распределение Пуассона имеет скошенную форму (длинный хвост справа у функции вероятности), но при увеличении параметра λ становится все более симметричным.

Примечание : Для построения интегральной функции распределения идеально подходит диаграмма типа График , для плотности распределения – Гистограмма с группировкой . Подробнее о построении диаграмм читайте статью Основные типы диаграмм .

Примечание : Среднее и дисперсия (квадрат стандартного отклонения ) равны параметру распределения Пуассона – λ (см. файл примера лист Пример ).

На какие вопросы отвечает гистограмма распределения?

Гистограмма – это один из моих самых любимых типов диаграмм, поскольку она дает огромное количество информации о данных.

В данном случае мы хотим знать, как много участников окажется в возрастных группах 20-ти, 30-ти, 40-ка лет и так далее. Гистограмма наглядно покажет это, поэтому определить закономерности и отклонения будет довольно легко.

«Неужели наше мероприятие не интересно гражданам в возрасте от 20 до 29 лет?»

Возможно, мы захотим немного изменить детализацию картины и разбить население на две возрастные группы. Это покажет нам, что в мероприятии примут участие большей частью молодые люди:

[Excel] Рассчитайте второе распределение вероятности распределения Пуассона с использованием функции Excel

http-equiv=»Content-Type» content=»text/html;charset=UTF-8″>yle=»margin-bottom:5px;»>Теги:  excel

пример:

Два распределения и распределения Пуассона следующих параметров

Два распределения

1, выберите Box Box, добавьте функцию

2, выберите функцию класса статистики

3. Выберите два функции вероятностей распределения

4, введите соответствующие параметры

Примечание:

(1) Нажмите соответствующую ячейку при вводе параметров.

(2) Последнее пустое если рассчитано, является значением функции распределения, заполните: True, если вычисляется значением наполнения функции вероятности: false

Значение функции распределения рассчитывается здесь.

распределение Пуассона

1, 2.

3, выберите функцию распространения Пуассона

4, введите соответствующие параметры

Примечание:

Значение вычисления k составляет λ

Интеллектуальная рекомендация

Заявление SQL получает интервал интервала времени Запишите оператор SQL, который сегментировал интервал времени, сегментированный ранее. Заявление SQL с 30 -минутным интервалом: Вы можете получать пер…

Введение в использование ExcutorThreadPool Четыре пула потоков: FixedThreadPool, CachedThreadPool, ScheduledThreadPool, SingleThreadPool. Поток фиксированной длины, вы можете контролировать максимальн…

Введение в процесс создания пружины: Распространенные причины неудачного создания…

1 Цель: уменьшить зависимость и уменьшить сцепление. ◦ Разделение, изменение и добавление частей, не влияя на других. Такие как наследство. Принцип обращения зависимостей: истинное программирование ин…

В этой статье подробно объясняется, как использовать jupyter lab для управления вашим JetBot в браузере и как программировать JetBot через python. Моя статья о самоуправлении была впервые опубликована…

Вам также может понравиться

1. Открыть переднюю страницу, выберите Файл — New — сайт Картинки следующие: 2, укажите местоположение нового сайта. Здесь вручную введите каталог для сохранения. Например, C: \ A Картинки следующие: …

     …

Красивый анализ данных 3 Все ссылкаDatawhale — Красивый анализ данных Анализ данных истории 1 Анализ данных истории — Pandas Исследуемый анализ данных, импортированных Numpy и Pandas перед началом Сор…

Разработка игр для Android2.1 — применение технологии двойной буферизации В последние несколько дней я работал над разработкой игры и обнаружил, что часто бывают вероятностные исключения нулевых указа…

Установите Python3.6.1 под Linux Python-3.6.1 скачать Распахнуть, компилировать, установить Наконец, следующий код указывает на то, что Python3.6.1 успешно установлен. Если подсказывает успешно устано…

Задача

Типичным применением Распределения Пуассона в контроле качества является модель количества дефектов, которые могут появиться в приборе или устройстве.

Например, при среднем количестве дефектов в микросхеме λ (лямбда) равном 4, вероятность, что случайно выбранная микросхема будет иметь 2 или меньше дефектов, равна: = ПУАССОН.РАСП(2;4;ИСТИНА)=0,2381

Третий параметр в функции установлен = ИСТИНА, поэтому функция вернет интегральную функцию распределения , то есть вероятность того, что число случайных событий окажется в диапазоне от 0 до 4 включительно.

Вычисления в этом случае производятся по формуле:

Вероятность того, что случайно выбранная микросхема будет иметь ровно 2 дефекта, равна: = ПУАССОН.РАСП(2;4;ЛОЖЬ)=0,1465

Третий параметр в функции установлен = ЛОЖЬ, поэтому функция вернет плотность вероятности.

Вероятность того, что случайно выбранная микросхема будет иметь больше 2-х дефектов, равна: =1-ПУАССОН.РАСП(2;4;ИСТИНА) =0,8535

Примечание : Если x не является целым числом, то при вычислении формулы дробная часть числа отбрасывается . Формулы =ПУАССОН.РАСП( 2 ; 4; ЛОЖЬ) и =ПУАССОН.РАСП( 2,9 ; 4; ЛОЖЬ) вернут одинаковый результат.

Понравилась статья? Поделиться с друзьями:
Самоучитель Брин Гвелл
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: