Содержание
- 1 Определения
- 1.1 Функция вероятностных масс
- 1.2 Кумулятивная функция распределения
- 1.3 Альтернативные составы
- 1.4 Примеры
- 1.4.1 Продажа конфет
- 1.4.2 Продолжительность пребывания в больнице
- 2 Свойства
- 2.1 Ожидание
- 2.2 Разница
- 2.3 Связь с биномиальной теоремой
- 2.4 Отношение рекуррентности
- 3 Связанные распределения
- 3.1 Пуассон распределение
- 3.2 Гамма – Пуассоновская смесь
- 3.3 Распределение суммы геометрически распределенных случайных величин
- 3.4 Представление в виде составного распределения Пуассона
- 3.5 (a, b, 0) класс распределений
- 4 Статистические вывод
- 4.1 Оценка параметров
- 4.1.1 MVUE для p
- 4.1.2 Оценка максимального правдоподобия
- 4.1 Оценка параметров
- 5 Возникновение и приложения
- 5.1 Время ожидания в процессе Бернулли
- 5.2 Сверхдисперсный Пуассон
- 6 История
- 7 См. Также
- 8 Ссылки
Отрицательное Биномиальное распределение в MS EXCEL
В MS EXCEL, начиная с версии 2010, для Отрицательного Биномиального распределения имеется функция ОТРБИНОМ.РАСП() , английское название NEGBINOM.DIST(), которая позволяет вычислить вероятность возникновения количества неудач до получения указанного количества успехов при заданной вероятности успеха.
Это определение несколько отличается от формулировки приведенной выше. Если количество неудач обозначить k, и учитывая, что k=x-r (общее количество испытаний минус количество успехов), то вышеуказанную формулу плотности вероятности можно переписать следующим образом:
Именно это формула и лежит в основе функции ОТРБИНОМ.РАСП() (с точностью до обозначения: k нужно заменить на х ).
В файле примера на листе Пример приведен расчет плотности вероятности 2-мя способами. Естественно, оба способа возвращают одинаковый результат, но первый способ — через общее количество испытаний, воспринимается более естественно. Ниже все же используется подход, принятый в MS EXCEL: через количество неудач.
Чтобы вычислить функцию плотности вероятности p(x), см. формулу выше, необходимо установить четвертый аргумент в функции ОТРБИНОМ.РАСП() равным ЛОЖЬ. Для вычисления интегральной функции распределения (сумма вероятностей возникновения количества неудач от 0 до получения указанного количества «успехов» r ), необходимо установить четвертый аргумент равным ИСТИНА.
Примечание : До MS EXCEL 2010 в EXCEL была функция ОТРБИНОМРАСП() , которая позволяет вычислить только плотность вероятности . ОТРБИНОМРАСП() оставлена в MS EXCEL 2010 для совместимости. В файле примера приведена более сложная формула на основе функции ОТРБИНОМРАСП() и для вычисления интегральной функции распределения . Там же приведена формула для вычисления вероятности через определение (использована функция ЧИСЛКОМБ() ).
В файле примера приведены графики плотности распределения вероятности и интегральной функции распределения .
Примечание : Для построения интегральной функции распределения идеально подходит диаграмма типа График , для плотности распределения – Гистограмма с группировкой . Подробнее о построении читайте статью Основные типы диаграмм .
Примечание : Для удобства написания формул в файле примера созданы Имена для параметров Отрицательного Биномиального распределения : r и p.
Примечание : В функции ОТРБИНОМ.РАСП() при нецелом значении х , дробная часть отбрасывается . Например, следующие формулы вернут одно и тоже значение: ОТРБИНОМ.РАСП( 2 ; 5; 0,4; ИСТИНА)= ОТРБИНОМ.РАСП( 2,9 ; 5; 0,4; ИСТИНА)
Нормальное распределение. Построение графика в Excel. Концепция шести сигм
Наверное, не все знают, что в Excel есть встроенная функция для построения нормального распределения. Графики нормального распределения часто используются для демонстрации идей статистической обработки данных.
Функция НОРМРАСП имеет следующий синтаксис:
НОРМРАСП (Х; среднее; стандартное_откл; интегральная)
Х — аргумент функции; фактически НОРМРАСП можно трактовать как y=f(x); при этом функция возвращает вероятность реализации события Х
Среднее (µ) — среднее арифметическое распределения; чем дальше Х от среднего, тем ниже вероятность реализации такого события
Стандартное_откл (σ) — стандартное отклонение распределения; мера кучности; чем меньше σ, тем выше вероятность у тех Х, которые расположены ближе к среднему
Интегральная — логическое значение, определяющее форму функции. Если «интегральная» имеет значение ИСТИНА, функция НОРМРАСП возвращает интегральную функцию распределения, тот есть суммарную вероятность всех событий для аргументов от -∞ до Х; если «интегральная» имеет значение ЛОЖЬ, возвращается вероятность реализации события Х, точнее говоря, вероятность событий находящихся в некотором диапазоне вокруг Х
Например, для µ=0 имеем:
Скачать заметку в формате Word, пример в формате Excel
Здесь по оси абсцисс единица измерения – σ, или (что то же самое), можно сказать, что график построен для σ = 1. То есть, «-2» на графике означает -2σ. По оси ординат шкала убрана умышленно, так как она лишена смысла. Точнее говоря, высота кривой зависит от плотности точек на оси абсцисс, по которым мы строим график. Например, если на интервал от 0 до 1σ приходится 10 точек, то высота в максимуме составит 4%, а если 20 точек – 2%. Здесь проценты означают вероятность попадания случайной величины в узкий диапазон окрестности точки на оси абсцисс. Зато имеет смысл площадь под кривой на определенном интервале. И эта площадь не зависит от плотности точек. Так, например, площадь под кривой на интервале от 0 до 1σ составляет 34,13%. Это значение можно интерпретировать следующим образом: с вероятностью 68,26% случайная величина Х попадет в диапазон µ ± σ.
Теперь, наверное, вам будет лучше понятен смысл выражения «качество шести сигм». Оно означает, что производство налажено таким образом, что случайная величина Х (например, диаметр вала) находясь в диапазон µ ± 6σ, всё еще удовлетворяет техническим условиям (допускам). Это достигается за счет значительного уменьшения сигмы, то есть случайная величина Х очень близка к нормативному значению µ. На графике ниже представлено три ситуации, когда границы допуска остаются неизменными, а благодаря повышению качества (уменьшению вариабельности, сужению сигма) доля брака сокращается:
На первом рисунке только 1,5σ попадают в границы допуска, то есть только 86,6% деталей являются годными. На втором рисунке уже 3σ попадают в границы допуска, то есть 99,75% являются годными. Но всё еще 25 деталей из каждых 10 000 произведенных являются браком. На третьем рисунке целых 6σ попадают в границы допуска, то есть в брак попадут только две детали на миллиард изготовленных!
Вообще-то говоря, измерение качества в терминах сигм использует не совсем нормальное распределение. Вот что пишет на эту тему Википедия:
Опыт показывает, что показатели процессов имеют тенденцию изменяться с течением времени. В результате со временем в промежуток между границами поля допуска будет входить меньше, чем было установлено первоначально. Опытным путём было установлено, что изменение параметров во времени можно учесть с помощью смещения в 1,5 сигма. Другими словами, с течением времени длина промежутка между границами поля допуска под кривой нормального распределения уменьшается до 4,5 сигма вследствие того, что среднее процесса с течением времени смещается и/или среднеквадратическое отклонение увеличивается.
Широко распространённое представление о «процессе шесть сигма» заключается в том, что такой процесс позволяет получить уровень качества 3,4 дефектных единиц на миллион готовых изделий при условии, что длина под кривой слева или справа от среднего будет соответствовать 4,5 сигма (без учёта левого или правого конца кривой за границей поля допуска). Таким образом, уровень качества 3,4 дефектных единиц на миллион готовых изделий соответствует длине промежутка 4,5 сигма, получаемых разницей между 6 сигма и сдвигом в 1,5 сигма, которое было введено, чтобы учесть изменение показателей с течением времени. Такая поправка создана для того, чтобы предупредить неправильною оценку уровня дефектности, встречающееся в реальных условиях.
С моей точки зрения, не вполне внятное объяснение. Тем не менее, во всем мире принята следующая таблица соответствия числа дефектов и уровня качества в сигмах:
Практическое использование распределений.
Рассмотренные предельные распределения интересны не только тем, что их использование облегчает расчеты вероятностей событий в схеме Бернулли, но и тем, что они описывают особые классы случайных величин, имеющих самостоятельное значение вне схемы Бернулли.
4.1. Нормальное распределение.
Нормальное распределение относится к числу наиболее распространенных и важных.
Оно часто используется для приближенного описания многих случайных явлений, когда интересующий нас результат складывается из большого количества независимых случайных факторов, среди которых нет сильно выделяющихся.
4.2. Распределение Пуассона.
Распределение Пуассона играет важную роль для описания “редких” событий в физике, теории связи, теории надежности, теории массового обслуживания и т.д. – там, где в течение определенного времени может происходить случайное число каких-то событий ( радиоактивных распадов, телефонных вызовов, отказов оборудования, несчастных случаев и т.п.).
Обратная функция БИНОМ.ОБР()
Вспомним график функции Биномиального распределения :
Решим задачу. Предположим, что для целей контроля качества нам требуется определить наибольшее допустимое количество дефектных изделий, которое еще позволяет обойтись без отбраковки всей партии.
Задана величина выборки из партии ( n =20) и р= 0,2 — доля дефектных изделий, которая обычно наблюдается в данном производственном процессе. Также пусть задана вероятность допустить ошибку 1-го рода (см. статью про уровень доверия ) равная 90%. Пороговый приемочный критерий можно вычислить по формуле =БИНОМ.ОБР(20; 0,2; 90%) . Формула вернет значение 6 — наибольшее количество дефектных изделий, допустимое в выборке .
Примечание : Третий аргумент функции БИНОМ.ОБР() называется Альфа ( α error, type I error, риск производителя, альфа-риск ) и представляет собой вероятность допустить ошибку 1-го рода при проверке статистической гипотезы (см. статью Проверка статистических гипотез в MS EXCEL о равенстве среднего значения распределения (дисперсия известна) ).
Предположим, что в выборке обнаружилось 7 дефектных изделий. Это означает, что «очень вероятна» ситуация, что изменилась доля дефектных изделий p , которая является характеристикой нашего производственного процесса. Хотя такая ситуация «очень вероятна», но существует вероятность (альфа-риск, ошибка 1-го рода, «ложная тревога»), что все же p осталась без изменений, а увеличенное количество дефектных изделий обусловлено случайностью выборки.
Как видно на рисунке ниже, 7 – количество дефектных изделий, которое допустимо для процесса с p=0,21 при том же значении Альфа . Это служит иллюстрацией, что при превышении порогового значения дефектных изделий в выборке, p «скорее всего» увеличилось. Фраза «скорее всего» означает, что существует всего лишь 10% вероятность (100%-90%) того, что отклонение доли дефектных изделий выше порогового вызвано только сучайными причинами.
Таким образом, превышение порогового количества дефектных изделий в выборке, может служить сигналом, что процесс расстроился и стал выпускать б о льший процент бракованных изделий.
Примечание : До MS EXCEL 2010 в EXCEL была функция КРИТБИНОМ() , которая эквивалентна БИНОМ.ОБР() . КРИТБИНОМ() оставлена в MS EXCEL 2010 и выше для совместимости.
Построение графика нормального распределения
Прежде всего необходимо разбить наш массив на периоды. Для этого определяем минимальное и максимальное значение, размер каждого периода или шаг, с которым будет увеличиваться период.
Далее строим таблицу с категориями. Нижняя граница (B11) равняется округленному вниз ближайшему кратному числу. Остальные категории увеличиваются на значение шага. Формула в ячейке B12 и последующих будет выглядеть:
=ЕСЛИ(A12;B11+$B$6; «»)
В столбце X будет производится подсчет количества переменных в заданном промежутке. Для этого воспользуемся формулой ЧАСТОТА(), которая имеет два аргумента: массив данных и массив интервалов. Выглядеть формула будет следующим образом =ЧАСТОТА(Data!A1:A175;B11:B20). Также стоит отметить, что в таком варианте данная функция будет работать как формула массива, поэтому по окончании ввода необходимо нажать сочетание клавиш Ctrl+Shift+Enter.
Таким образом у нас получилась таблица с данными, с помощью которой мы сможем построить диаграмму с нормальным распределением. Воспользуемся диаграммой вида Гистограмма с группировкой, где по оси значений будет отложено количество переменных в данном промежутке, а по оси категорий – периоды.
Осталось отформатировать диаграмму и наш график с нормальным распределением готов.
Итак, мы познакомились с вами с нормальным распределением, узнали, что Excel позволяет генерировать массив данных с помощью формулы НОРМ.ОБР() для определенного среднего значения и стандартного отклонения и научились приводить данный массив в графический вид.
Для лучшего понимания, вы можете скачать файл с примером построения нормального распределения.
Построим диаграмму распределения в Excel. А также рассмотрим подробнее функции круговых диаграмм, их создание.
Переменная альтернативного признака
Для того, чтобы в анализе задействовать математический аппарат, результаты подобных наблюдений следует записать в числовом виде. Для этого положительному исходу присваивают число 1, отрицательному – 0. Другими словами, мы имеем дело с переменной, которая может принимать только два значения: 0 или 1.
Какую пользу отсюда можно извлечь? Вообще-то не меньшую, чем от обычных данных. Так, легко подсчитать количество положительных исходов – достаточно просуммировать все значения, т.е. все 1 (успехи). Можно пойти далее, но для этого потребуется ввести парочку обозначений.
Первым делом нужно отметить, что положительные исходы (которые равны 1) имеют некоторую вероятность появления. Например, выпадение орла при подбрасывании монеты равно ½ или 0,5. Такая вероятность традиционно обозначается латинской буквой p
. Следовательно, вероятность наступления альтернативного события равна 1 — p
, которую еще обозначают через q
, то есть q = 1 – p
. Указанные обозначения можно наглядно систематизировать в виде таблички распределения переменной X
.
Мы получили перечень возможных значений и их вероятности. Можно рассчитать математическое ожидание
и дисперсию
. Матожидание – это сумма произведений всех возможных значений на соответствующие им вероятности:
Вычислим матожидание, используя обозначения в таблицы выше.
Получается, что математическое ожидание альтернативного признака равно вероятности этого события – p
.
Теперь определим, что такое дисперсия альтернативного признака. Дисперсия – есть средний квадрат отклонений от математического ожидания. Общая формула (для дискретных данных) имеет вид:
Отсюда дисперсия альтернативного признака:
Нетрудно заметить, что эта дисперсия имеет максимум 0,25 (при p=0,5)
.
Стандартное отклонение – корень из дисперсии:
Максимальное значение не превышает 0,5.
Как видно, и математическое ожидание, и дисперсия альтернативного признака имеют очень компактный вид.
Биномиальное распределение случайной величины
Рассмотрим ситуацию под другим углом. Действительно, кому интересно, что среднее выпадение орлов при одном бросании равно 0,5? Это даже невозможно представить. Интересней поставить вопрос о числе выпадения орлов при заданном количестве бросков.
Другими словами, исследователя часто интересует вероятность наступления некоторого числа успешных событий. Это может быть количество бракованных изделий в проверяемой партии (1- бракованная, 0 — годная) или количество выздоровлений (1 – здоров, 0 – больной) и т.д. Количество таких «успехов» будет равно сумме всех значений переменной X, т.е. количеству единичных исходов.
Случайная величина B называется биномиальной и принимает значения от 0 до n (при B = 0 – все детали годные, при B = n – все детали бракованные). Предполагается, что все значения x независимы между собой. Рассмотрим основные характеристики биномиальной переменной, то есть установим ее математическое ожидание, дисперсию и распределение.
Матожидание биномиальной переменной получить очень легко. Математическое ожидание суммы величин есть сумма математических ожиданий каждой складываемой величины, а оно у всех одинаковое, поэтому:
Например, математическое ожидание количества выпавших орлов при 100 подбрасываниях равно 100 × 0,5 = 50.
Теперь выведем формулу дисперсии биномиальной переменной. Дисперсия суммы независимых случайных величин есть сумма дисперсий. Отсюда
Стандартное отклонение, соответственно
Для 100 подбрасываний монеты стандартное отклонение количества орлов равно
И, наконец, рассмотрим распределение биномиальной величины, т.е. вероятности того, что случайная величина B будет принимать различные значения k, где 0≤ k ≤n. Для монеты эта задача может звучать так: какова вероятность выпадения 40 орлов при 100 бросках?
Чтобы понять метод расчета, представим, что монета подбрасывается всего 4 раза. Каждый раз может выпасть любая из сторон. Мы задаемся вопросом: какова вероятность выпадения 2 орлов из 4 бросков. Каждый бросок независим друг от друга. Значит, вероятность выпадения какой-либо комбинации будет равна произведению вероятностей заданного исхода для каждого отдельного броска. Пусть О – это орел, Р – решка. Тогда, к примеру, одна из устраивающих нас комбинаций может выглядеть как ООРР, то есть:
Вероятность такой комбинации равняется произведению двух вероятностей выпадения орла и еще двух вероятностей не выпадения орла (обратное событие, рассчитываемое как 1 — p), т.е. 0,5×0,5×(1-0,5)×(1-0,5)=0,0625. Такова вероятность одной из устраивающих нас комбинации. Но вопрос ведь стоял об общем количестве орлов, а не о каком-то определенном порядке. Тогда нужно сложить вероятности всех комбинаций, в которых присутствует ровно 2 орла. Ясно, все они одинаковы (от перемены мест множителей произведение не меняется). Поэтому нужно вычислить их количество, а затем умножить на вероятность любой такой комбинации. Подсчитаем все варианты сочетаний из 4 бросков по 2 орла: РРОО, РОРО, РООР, ОРРО, ОРОР, ООРР. Всего 6 вариантов.
Следовательно, искомая вероятность выпадения 2 орлов после 4 бросков равна 6×0,0625=0,375.
Однако подсчет подобным образом утомителен. Уже для 10 монет методом перебора получить общее количество вариантов будет очень трудно. Поэтому умные люди давно изобрели формулу, с помощью которой рассчитывают количество различных сочетаний из n элементов по k, где n – общее количество элементов, k – количество элементов, варианты расположения которых и подсчитываются. Формула сочетания из n элементов по k такова:
Подобные вещи проходят в разделе комбинаторики. Всех желающих подтянуть знания отправляю туда. Отсюда, кстати, и название биномиального распределения (формула выше является коэффициентом в разложении бинома Ньютона).
Формулу для определения вероятности легко обобщить на любое количество n и k. В итоге формула биномиального распределения имеет следующий вид.
Количество подходящих под условие комбинаций умножить на вероятность одной из них.
Для практического использования достаточно просто знать формулу биномиального распределения. А можно даже и не знать – ниже показано, как определить вероятность с помощью Excel. Но лучше все-таки знать.
Рассчитаем по этой формуле вероятность выпадения 40 орлов при 100 бросках:
Или всего 1,08%. Для сравнения вероятность наступления математического ожидания этого эксперимента, то есть 50 орлов, равна 7,96%. Максимальная вероятность биномиальной величины принадлежит значению, соответствующему математическому ожиданию.
Задачи
Решения задач приведены в файле примера на листе Пример .
Задача1 . Нефтяная компания бурит скважины для добычи нефти. Вероятность обнаружить нефть в скважине равна 20%. Какова вероятность, что первая нефть будет получена с третьей попытки? Решение1 : =ОТРБИНОМ.РАСП(3-1;1;0,2;ЛОЖЬ)
Задача2 . Нефтяная компания бурит скважины для добычи нефти. Какова вероятность наличия 3-х нефтеносных скважин после бурения 7-й скважины. Вероятность обнаружить нефть в скважине равна 20%. Решение2 : =ОТРБИНОМ.РАСП(7-3;3;0,2;ЛОЖЬ)
Задача3 . Нефтяная компания бурит скважины для добычи нефти. Какова вероятность наличия 3-х нефтеносных скважин после бурения 7-ми скважин. Вероятность обнаружить нефть в скважине равна 20%. Решение3 : =ОТРБИНОМ.РАСП(7-3;3;0,2;ИСТИНА)
Распределение Фишера (F-распределение)
Случайная величина F имеет распределение Фишера, если она определяется так:
(9.7)
где — независимые случайные величины, имеющие распределение с степенями свободы, т. е. можно записать в следующем виде: (9.8)
Безразмерная случайная величина F (9.8) имеет плотность распределения, определяемую следующей формулой:
(9.9)
Распределение случайной величины F зависит от двух параметров степеней свободы. График плотности распределения случайной величины F для разного числа степеней свободы приведен на рис. 9.5
Квантили распределения Фишера для заданного уровня вероятности и числа степеней свободы определяются из условия
На рис. 9.6 показано, что надо так выбрать , чтобы площадь заштрихованной фигуры была равна заданной вероятности
Как правило, квантили находят по таблицам распределения Фишера и для их определения необходимо задать три параметра: уровень вероятности и число степеней свободы
Биномиальное распределение с примерами
Биномиальное распределение — это распределение вероятностей, применимое к биномиальным экспериментам. Это количество успешных попыток за определенное количество попыток. Биномиальное распределение можно представить как распределение вероятностей количества выпавших орлов при подбрасывании монеты в конкретном эксперименте, состоящем из фиксированного количества подбрасываний монеты. В этом сообщении блога мы изучим биномиальное распределение с помощью примеров . Если вы начинающий специалист по обработке и анализу данных, стремящийся лучше изучить биномиальное распределение или лучше понять его, этот пост может быть очень полезен.
Что такое биномиальное распределение?
Биномиальное распределение — это дискретное распределение вероятностей, которое представляет вероятности биномиальных случайных величин в биномиальном эксперименте. Биномиальное распределение определяется как распределение вероятностей, связанное с биномиальным экспериментом, где биномиальная случайная величина указывает, сколько успехов или неудач произошло в этом пространстве выборки
Специалистам по данным и специалистам в других областях важно понимать эту концепцию, поскольку биномы часто используются в бизнес-приложениях
Что такое случайная величина?
Случайная величина представляет собой переменную, которая может принимать случайные значения в эксперименте. Скажем, случайная величина, представляющая количество бракованных изделий, найденных в 100 предметах, выбранных случайным образом. Здесь 100 элементов представляют 100 испытаний. Может быть несколько экспериментов, включающих случайную выборку 100 предметов и подсчет количества дефектных предметов.
- В 1-м эксперименте 5 изделий оказались бракованными.
- Во 2-м опыте, 9товары признаны бракованными.
В приведенном выше эксперименте количество дефектных элементов можно назвать СЛУЧАЙНОЙ переменной. Случайная величина также представлена буквой X. X принимает значения 5 и 9 в вышеупомянутых экспериментах.
Когда значение случайной величины может принимать только конечные значения, случайную величину также можно назвать случайной дискретной величиной. Когда значение случайной величины может принимать бесконечные значения, случайную величину также можно назвать случайная непрерывная переменная .
Все возможные значения (или результаты), которые может принимать случайная величина, также называются выборочным пространством .
Что такое биномиальная случайная величина?
В биномиальном эксперименте результат каждого испытания в эксперименте может принимать одно из двух значений: успех или неудача. Каждое испытание в биномиальном эксперименте также можно назвать испытанием Бернулли . Для одного испытания биномиальное распределение можно также назвать Распределение Бернулли. Вы можете проверить мой пост о распределении Бернулли, объясненном на примерах Python. Другими словами, результат каждого испытания классифицируется в соответствии с двумя уровнями категориальной переменной. Вот несколько примеров испытаний Бернулли:
- При подбрасывании монеты может быть либо успех (ГОЛОВА), либо неудача (РЕШКА).
- При обнаружении дефектных изделий результатом может быть либо успех (предмет дефектный), либо отказ (предмет недефектный).
- При бросании кубика результатом может быть либо успех (одно из чисел от 1 до 6 (скажем, шесть-6)) либо провал (любое число, кроме) в противном случае.
Результат интереса к испытанию эксперимента часто называют успехом .
Биномиальная случайная величина может быть числом успехов в эксперименте, состоящем из N испытаний . Таким образом, ниже приведены некоторые примеры биномиальной случайной величины:
- Количество успехов (орел) в эксперименте из 10 попыток подбрасывания монеты; Здесь образец пространства {0, 1, 2, … 10}
- Количество успехов (шесть) в эксперименте из 10 попыток прокатки игральной кости; Здесь выборочное пространство равно {0, 1, 2, …10}
- Количество успешных результатов (бракованных элементов) в эксперименте из 10 попыток проверки 10 предметов; Здесь выборочное пространство равно {0, 1, 2, …10}
Таблица и диаграмма биномиального распределения
Теперь давайте создадим таблица распределения вероятностей в Excel. Распределение вероятностей вычисляет вероятность каждого количества событий.
1 | = БИНОМРАСП (B10,10; 1/2; ЛОЖЬ) |
Читая эту таблицу: вероятность того, что ровно 7 из 10 монет выпадет орлом, составляет около 12%.
Мы можем создать диаграмму из приведенной выше таблицы распределения биномиальной вероятности.
Диаграмма биномиального распределения
Обратите внимание, что биномиальное распределение для этого эксперимента достигает максимума при x = 5. Это потому, что ожидаемое количество орлов при подбрасывании справедливой монеты 10 раз равно 5
Статистический вывод
MVUE для p
Предположим, что p неизвестно, и проводится эксперимент, в котором заранее решено, что выборка будет продолжаться до тех пор, пока не будет найдено r успешных результатов. Достаточной статистикой для эксперимента является k, количество неудач.
При оценке p несмещенная оценка минимальной дисперсии составляет
- p ^ = r — 1 r + k — 1. {\ displaystyle {\ widehat {p}} = {\ frac {r-1} {r + k-1}}.}
Оценка максимального правдоподобия
максимальное правдоподобие оценка p составляет
- p ~ = rr + k, {\ displaystyle {\ widetilde {p}} = {\ frac {r} {r + k}},}
, но это смещение оценка. Однако его обратная величина (r + k) / r является несмещенной оценкой 1 / p.
Оценка максимального правдоподобия существует только для выборок, для которых выборочная дисперсия больше, чем выборочное среднее. Функция правдоподобия для N iid наблюдений (k 1,…, k N) равна
- L (r, p) = ∏ i = 1 N е (ки; р, п) {\ Displaystyle L (г, р) = \ prod _ {я = 1} ^ {N} f (k_ {я}; г, р) \, \!}
, из которого мы вычисляем функцию логарифма правдоподобия
- ℓ (r, p) = ∑ i = 1 N ln (Γ (ki + r)) — ∑ i = 1 N ln (ki!) — N ln (Γ (r)) + ∑ i = 1 N ki ln (1 — p) + N r ln (p). {\ displaystyle \ ell (r, p) = \ sum _ {i = 1} ^ {N} \ ln (\ Gamma (k_ {i} + r)) — \ sum _ {i = 1} ^ {N} \ ln (k_ {i}!) — N \ ln (\ Gamma (r)) + \ sum _ {i = 1} ^ {N} k_ {i} \ ln (1-p) + Nr \ ln (p).}
Чтобы найти максимум, возьмем частные производные по r и p и положим их равными нулю:
- ∂ ℓ (r, p) ∂ p = — N r 1 1 — p = 0 {\ displaystyle {\ frac {\ partial \ ell (r, p)} {\ partial p}} = \ left -Nr {\ frac {1} {1-p}} = 0}и
- ∂ ℓ (r, p) ∂ р знак равно — N ψ (г) + N пер (1 — р) = 0 {\ Displaystyle {\ гидроразрыва {\ partial \ ell (г, р)} {\ partial r}} = \ left -N \ psi (r) + N \ ln (1-p) = 0}
где
- ψ (k) = Γ ′ (k) Γ (k) {\ displaystyle \ psi (k) = {\ frac {\ Gamma ‘(k)} {\ Gamma (k)}} \!}- это дигамма-функция.
Решение первого уравнения для p дает:
- p = ∑ i = 1 N ki N r + ∑ i = 1 N ki {\ displaystyle p = {\ frac {\ sum _ {i = 1} ^ {N} k_ {i}} {Nr + \ sum _ {i = 1} ^ {N} k_ {i}}}}
Подставляя это во втором уравнении дает:
- ∂ ℓ (r, p) ∂ r = — N ψ (r) + N ln (rr + ∑ i = 1 N ки / Н) Знак равно 0 {\ displaystyle {\ frac {\ partial \ ell (r, p)} {\ partial r}} = \ left -N \ psi (r) + N \ ln \ left ({\ frac {r} {r + \ sum _ {i = 1} ^ {N} k_ {i} / N}} \ right) = 0}
Это уравнение не может быть решено относительно r в закрытой форме. Если требуется численное решение, можно использовать итерационный метод, такой как метод Ньютона. В качестве альтернативы можно использовать алгоритм ожидания-максимизации.