Двумерная функция Гаусса
Гауссова кривая с двумерной областью
В двух измерениях сила, к которой е возводится в гауссову функцию любой отрицательно определенной квадратичной формы. Следовательно, наборы уровней гауссианы всегда будут эллипсами.
Частным примером двумерной функции Гаусса является
- ж(Икс,у)=Аexp(−((Икс−Иксо)22σИкс2+(у−уо)22σY2)).{ Displaystyle е (х, у) = А ехр влево (- влево ({ гидроразрыва {(х-х_ {o}) ^ {2}} {2 sigma _ {X} ^ {2}}) } + { frac {(y-y_ {o}) ^ {2}} {2 sigma _ {Y} ^ {2}}} right) right).}
Здесь коэффициент А это амплитуда, Иксо, yо центр, а σИкс, σу являются Икс и у распространение капли. Рисунок справа был создан с использованием А = 1, Иксо = 0, уо = 0, σИкс = σу = 1.
Объем под функцией Гаусса определяется выражением
- V=∫−∞∞∫−∞∞ж(Икс,у)dИксdу=2πАσИксσY.{ Displaystyle V = int _ {- infty} ^ { infty} int _ {- infty} ^ { infty} f (x, y) , dx , dy = 2 pi A sigma _ {X} sigma _ {Y}.}
В общем, двумерная эллиптическая функция Гаусса выражается как
- ж(Икс,у)=Аexp(−(а(Икс−Иксо)2+2б(Икс−Иксо)(у−уо)+c(у−уо)2)){ displaystyle f (x, y) = A exp left (- left (a (x-x_ {o}) ^ {2} + 2b (x-x_ {o}) (y-y_ {o}) ) + c (y-y_ {o}) ^ {2} right) right)}
где матрица
- аббc{ displaystyle left }
является положительно определенный.
Используя эту формулировку, рисунок справа можно создать с помощью А = 1, (Иксо, уо) = (0, 0), а = c = 1/2, б = 0.
Значение параметров для общего уравнения
Для общего вида уравнения коэффициент А — высота пика и (Иксо, уо) является центром капли.
Если мы установим
- а=потому что2θ2σИкс2+грех2θ2σY2б=−грех2θ4σИкс2+грех2θ4σY2c=грех2θ2σИкс2+потому что2θ2σY2{ displaystyle { begin {align} a & = { frac { cos ^ {2} theta} {2 sigma _ {X} ^ {2}}} + { frac { sin ^ {2} theta} {2 sigma _ {Y} ^ {2}}} b & = — { frac { sin 2 theta} {4 sigma _ {X} ^ {2}}} + { frac { sin 2 theta} {4 sigma _ {Y} ^ {2}}} c & = { frac { sin ^ {2} theta} {2 sigma _ {X } ^ {2}}} + { frac { cos ^ {2} theta} {2 sigma _ {Y} ^ {2}}} end {выравнивается}}}
затем мы поворачиваем каплю на угол по часовой стрелке θ{ displaystyle theta} (для вращения против часовой стрелки переверните знаки в б коэффициент). Это можно увидеть на следующих примерах:
θ={ displaystyle theta = 0} | θ=π6{ displaystyle theta = pi / 6} | θ=π3{ displaystyle theta = pi / 3} |
Используя следующие Октава кода, легко увидеть эффект изменения параметров
А = 1;x0 = ; y0 = ;sigma_X = 1;sigma_Y = 2;Икс, Y = сетка(-515, -515);за тета = число Пи100число Пи а = потому что(тета)^2(2*sigma_X^2) + грех(тета)^2(2*sigma_Y^2); б = -грех(2*тета)(4*sigma_X^2) + грех(2*тета)(4*sigma_Y^2); c = грех(тета)^2(2*sigma_X^2) + потому что(тета)^2(2*sigma_Y^2); Z = А*exp( - (а*(Икс-x0).^2 + 2*б*(Икс-x0).*(Y-y0) + c*(Y-y0).^2));серфить(Икс,Y,Z);затенение интерп;Посмотреть(-36,36)подождите, нажмите кнопкуконец
Такие функции часто используются в обработка изображений и в вычислительных моделях зрительная система функция — см. статьи на масштабное пространство и аффинный shn.
Также см многомерное нормальное распределение.
Гауссова или супергауссова функция высшего порядка
Более общая формулировка функции Гаусса с плоской вершиной и спадом по Гауссу может быть взята путем возведения содержания показателя в степень, п{ displaystyle P}:
ж(Икс)=Аexp(−((Икс−Иксо)22σИкс2)п).{ displaystyle f (x) = A exp left (- left ({ frac {(x-x_ {o}) ^ {2}} {2 sigma _ {X} ^ {2}}} right) ^ {P} right).}Эта функция известна как супергауссова функция и часто используется для формулировки гауссова пучка. В двумерной постановке функция Гаусса вдоль Икс{ displaystyle x} и у{ displaystyle y} можно комбинировать с потенциально разными пИкс{ displaystyle P_ {X}} и пY{ displaystyle P_ {Y}} чтобы сформировать эллиптическое гауссово распределение,ж(Икс,у)=Аexp(−((Икс−Иксо)22σИкс2+(у−уо)22σY2)п){ Displaystyle е (х, у) = А ехр влево (- влево ({ гидроразрыва {(х-х_ {o}) ^ {2}} {2 sigma _ {X} ^ {2}}) } + { frac {(y-y_ {o}) ^ {2}} {2 sigma _ {Y} ^ {2}}} right) ^ {P} right)} или прямоугольное распределение Гаусса, ж(Икс,у)=Аexp(−((Икс−Иксо)22σИкс2)пИкс−((у−уо)22σY2)пY){ Displaystyle е (х, у) = А ехр влево (- влево ({ гидроразрыва {(х-х_ {o}) ^ {2}} {2 sigma _ {X} ^ {2}}) } right) ^ {P_ {X}} — left ({ frac {(y-y_ {o}) ^ {2}} {2 sigma _ {Y} ^ {2}}} right) ^ {P_ {Y}} right)}.
Построение гистограммы распределения без использования надстройки Пакет анализа
Порядок действий при построении гистограммы в этом случае следующий:
- определить количество интервалов у гистограммы;
- определить ширину интервала (с учетом округления);
- определить границу первого интервала;
- сформировать таблицу интервалов и рассчитать количество значений, попадающих в каждый интервал (частоту);
- построить гистограмму.
СОВЕТ: Часто рекомендуют, чтобы границы интервала были на один порядок точнее самих данных и оканчивались на 5. Например, если данные в массиве определены с точностью до десятых: 1,2; 2,3; 5,0; 6,1; 2,1, …, то границы интервалов должны быть округлены до сотых: 1,25-1,35; 1,35-1,45; … Для небольших наборов данных вид гистограммы сильно зависит количества интервалов и их ширины. Это приводит к тому, что сам метод гистограмм, как инструмент описательной статистики, может быть применен только для наборов данных состоящих, как минимум, из 50, а лучше из 100 значений.
В наших расчетах для определения количества интервалов мы будем пользоваться формулой =ЦЕЛОЕ(КОРЕНЬ(n))+1 .
Примечание: Кроме использованного выше правила (число карманов = √n), используется ряд других эмпирических правил, например, правило Стёрджеса (Sturges): число карманов =1+log2(n). Это обусловлено тем, что например, для n=5000, количество интервалов по формуле √n будет равно 70, а правило Стёрджеса рекомендует более приемлемое количество — 13.
Расчет ширины интервала и таблица интервалов приведены в файле примера на листе Гистограмма . Для вычисления количества значений, попадающих в каждый интервал, использована формула массива на основе функции ЧАСТОТА() . О вводе этой функции см. статью Функция ЧАСТОТА() — Подсчет ЧИСЛОвых значений в MS EXCEL.
В MS EXCEL имеется диаграмма типа Гистограмма с группировкой, которая обычно используется для построения Гистограмм распределения.
В итоге можно добиться вот такого результата.
Примечание: О построении и настройке макета диаграмм см. статью Основы построения диаграмм в MS EXCEL.
Одной из разновидностей гистограмм является график накопленной частоты (cumulative frequency plot).
На этом графике каждый столбец представляет собой число значений исходного массива, меньших или равных правой границе соответствующего интервала. Это очень удобно, т.к., например, из графика сразу видно, что 90% значений (45 из 50) меньше чем 495.
СОВЕТ : О построении двумерной гистограммы см. статью Двумерная гистограмма в MS EXCEL.
Примечание: Альтернативой графику накопленной частоты может служить Кривая процентилей, которая рассмотрена в статье про Процентили.
Примечание: Когда количество значений в выборке недостаточно для построения полноценной гистограммы может быть полезна Блочная диаграмма (иногда она называется Диаграмма размаха или Ящик с усами).
Как построить диаграмму распределения в Excel
График нормального распределения имеет форму колокола и симметричен относительно среднего значения. Получить такое графическое изображение можно только при огромном количестве измерений. В Excel для конечного числа измерений принято строить гистограмму.
Внешне столбчатая диаграмма похожа на график нормального распределения. Построим столбчатую диаграмму распределения осадков в Excel и рассмотрим 2 способа ее построения.
Имеются следующие данные о количестве выпавших осадков:
Первый способ. Открываем меню инструмента «Анализ данных» на вкладке «Данные» (если у Вас не подключен данный аналитический инструмент, тогда читайте как его подключить в настройках Excel):
Выбираем «Гистограмма»:
Задаем входной интервал (столбец с числовыми значениями). Поле «Интервалы карманов» оставляем пустым: Excel сгенерирует автоматически. Ставим птичку около записи «Вывод графика»:
После нажатия ОК получаем такой график с таблицей:
В интервалах не очень много значений, поэтому столбики гистограммы получились низкими.
Теперь необходимо сделать так, чтобы по вертикальной оси отображались относительные частоты.
Найдем сумму всех абсолютных частот (с помощью функции СУММ). Сделаем дополнительный столбец «Относительная частота». В первую ячейку введем формулу:
Способ второй. Вернемся к таблице с исходными данными. Вычислим интервалы карманов. Сначала найдем максимальное значение в диапазоне температур и минимальное.
Чтобы найти интервал карманов, нужно разность максимального и минимального значений массива разделить на количество интервалов. Получим «ширину кармана».
Представим интервалы карманов в виде столбца значений. Сначала ширину кармана прибавляем к минимальному значению массива данных. В следующей ячейке – к полученной сумме. И так далее, пока не дойдем до максимального значения.
Для определения частоты делаем столбец рядом с интервалами карманов. Вводим функцию массива:
Вычислим относительные частоты (как в предыдущем способе).
Построим столбчатую диаграмму распределения осадков в Excel с помощью стандартного инструмента «Диаграммы».
Частота распределения заданных значений:
Вероятность
Вероятность, что подброшенная монета упадёт орлом вверх 50%, что при броске шестигранного кубика выпадет 4 – 16,7%, что завтра на кого-нибудь упадёт метеорит – 0.00000000294%. Это простые примеры, достаточно разделить количество желаемых событий на общее количество случаев и мы получаем вероятность события, но когда результаты эксперимента могут быть не только орлом или решкой (что эквивалентно да/нет), а большим набором данных. Например, вес батона хлеба, если мы возьмём в магазине 1000 буханок хлеба и взвесим каждую, то мы узнаем, что на самом деле батон не весит 400 грамм, результаты будут варьироваться в диапазоне 384-416 грамм (допуск разброса веса предусмотрен ГОСТом).
Нормальное распределение. Построение графика в Excel. Концепция шести сигм
Наверное, не все знают, что в Excel есть встроенная функция для построения нормального распределения. Графики нормального распределения часто используются для демонстрации идей статистической обработки данных.
Функция НОРМРАСП имеет следующий синтаксис:
НОРМРАСП (Х; среднее; стандартное_откл; интегральная)
Х — аргумент функции; фактически НОРМРАСП можно трактовать как y=f(x); при этом функция возвращает вероятность реализации события Х
Среднее (µ) — среднее арифметическое распределения; чем дальше Х от среднего, тем ниже вероятность реализации такого события
Стандартное_откл (σ) — стандартное отклонение распределения; мера кучности; чем меньше σ, тем выше вероятность у тех Х, которые расположены ближе к среднему
Интегральная — логическое значение, определяющее форму функции. Если «интегральная» имеет значение ИСТИНА, функция НОРМРАСП возвращает интегральную функцию распределения, тот есть суммарную вероятность всех событий для аргументов от -∞ до Х; если «интегральная» имеет значение ЛОЖЬ, возвращается вероятность реализации события Х, точнее говоря, вероятность событий находящихся в некотором диапазоне вокруг Х
Например, для µ=0 имеем:
Скачать заметку в формате Word, пример в формате Excel
Здесь по оси абсцисс единица измерения – σ, или (что то же самое), можно сказать, что график построен для σ = 1. То есть, «-2» на графике означает -2σ. По оси ординат шкала убрана умышленно, так как она лишена смысла. Точнее говоря, высота кривой зависит от плотности точек на оси абсцисс, по которым мы строим график. Например, если на интервал от 0 до 1σ приходится 10 точек, то высота в максимуме составит 4%, а если 20 точек – 2%. Здесь проценты означают вероятность попадания случайной величины в узкий диапазон окрестности точки на оси абсцисс. Зато имеет смысл площадь под кривой на определенном интервале. И эта площадь не зависит от плотности точек. Так, например, площадь под кривой на интервале от 0 до 1σ составляет 34,13%. Это значение можно интерпретировать следующим образом: с вероятностью 68,26% случайная величина Х попадет в диапазон µ ± σ.
Теперь, наверное, вам будет лучше понятен смысл выражения «качество шести сигм». Оно означает, что производство налажено таким образом, что случайная величина Х (например, диаметр вала) находясь в диапазон µ ± 6σ, всё еще удовлетворяет техническим условиям (допускам). Это достигается за счет значительного уменьшения сигмы, то есть случайная величина Х очень близка к нормативному значению µ. На графике ниже представлено три ситуации, когда границы допуска остаются неизменными, а благодаря повышению качества (уменьшению вариабельности, сужению сигма) доля брака сокращается:
На первом рисунке только 1,5σ попадают в границы допуска, то есть только 86,6% деталей являются годными. На втором рисунке уже 3σ попадают в границы допуска, то есть 99,75% являются годными. Но всё еще 25 деталей из каждых 10 000 произведенных являются браком. На третьем рисунке целых 6σ попадают в границы допуска, то есть в брак попадут только две детали на миллиард изготовленных!
Вообще-то говоря, измерение качества в терминах сигм использует не совсем нормальное распределение. Вот что пишет на эту тему Википедия:
Опыт показывает, что показатели процессов имеют тенденцию изменяться с течением времени. В результате со временем в промежуток между границами поля допуска будет входить меньше, чем было установлено первоначально. Опытным путём было установлено, что изменение параметров во времени можно учесть с помощью смещения в 1,5 сигма. Другими словами, с течением времени длина промежутка между границами поля допуска под кривой нормального распределения уменьшается до 4,5 сигма вследствие того, что среднее процесса с течением времени смещается и/или среднеквадратическое отклонение увеличивается.
Широко распространённое представление о «процессе шесть сигма» заключается в том, что такой процесс позволяет получить уровень качества 3,4 дефектных единиц на миллион готовых изделий при условии, что длина под кривой слева или справа от среднего будет соответствовать 4,5 сигма (без учёта левого или правого конца кривой за границей поля допуска). Таким образом, уровень качества 3,4 дефектных единиц на миллион готовых изделий соответствует длине промежутка 4,5 сигма, получаемых разницей между 6 сигма и сдвигом в 1,5 сигма, которое было введено, чтобы учесть изменение показателей с течением времени. Такая поправка создана для того, чтобы предупредить неправильною оценку уровня дефектности, встречающееся в реальных условиях.
С моей точки зрения, не вполне внятное объяснение. Тем не менее, во всем мире принята следующая таблица соответствия числа дефектов и уровня качества в сигмах:
Функция ФИ и плотность стандартного нормального распределения в Excel
Функция ФИ в Excel предназначена для определения значения плотности вероятности величины, описанной законом стандартного нормального распределения, и возвращает соответствующее число.
Значения функции плотности стандартного нормального распределения в Excel
Если случайная величина распределена непрерывно, она может иметь любое значение, взятое из интервала, в котором она определена. Такое число значений стремится к бесконечности, следовательно, вероятность попадания в какую-либо определенную точку из данного интервала стремится к нулю (сумма вероятностей должна соответствовать числу 1). Поэтому, является возможным только определение вероятности нахождения некоторой величины в заданном интервале значений. С этой целью было введено понятие плотности вероятности – производная функции распределения. Для вычисления вероятности определяют площадь, образованную кривой графика, осью абсцисс и двумя вертикальными линиями, проведенными от точек, соответствующих граничным значениям исследуемого интервала.
Рассматриваемая функции вычисляет то же значение, которое возвращает функция НОРМ.СТ.РАСП, у которой второй аргумент принимает значение ЛОЖЬ.
Пример 1. Построить график плотности вероятности для известных значений x, которые внесены в таблицу Excel.
Вид таблицы данных:
Для построения графика определим значения плотности для известных значений x. Используем формулу, предварительно выделив ячейки в диапазоне B2:B22:
=ФИ(A2)
Полученные значения:
Используем полученные данные для построения графика:
Значение плотности вероятности имеет смысл при определении вероятности нахождения величины в некотором диапазоне. Ее используют для вычисления интеграла с указанными граничными значениями некоторой величины, в результате чего получают вероятность нахождения некоторого значения в диапазоне, заданного этими граничными значениями.
В Excel функция плотности используется преимущественно для построения графиков. Вероятность определяется функцией НОРМ. СТ.РАСП (для стандартного нормального распределение) с последним аргументом, принимающим значение ИСТИНА.
Пример расчета плотности стандартного нормального распределения в Excel
Пример 2. Определить максимальное значение плотности вероятности для ряда значений двумя различными способами.
Вид таблицы данных:
Максимальное значение плотности вероятности для некоторой величины, распределенной по стандартному нормальному закону, можно определить с помощью функции МАКС, исследуя массив значений, возвращаемых функцией ФИ в формуле массива CTRL+SHIFT+Enter:
=МАКС(ФИ(A2:A9))
Полученный результат:
Другой способ – нахождение значения плотности для среднего значения известных величин. Однако, для начала необходимо стандартизировать имеющийся ряд значений с помощью функции НОРМАЛИЗАЦИЯ. Для нахождения используем формулу (вводить как формулу массива CTRL+SHIFT+Enter):
Полученное значение:
Небольшая разница в полученных значениях свидетельствует о том, что исследуемый ряд значений можно рассматривать как нормальное стандартное распределение некоторой величины.
Правила использования функции ФИ в Excel
Функция ФИ имеет следующую синтаксическую запись:
=ФИ(x)
x – обязательный, принимает число для некоторой величины, распределенной по стандартному нормальному закону, для которой необходимо определить значение плотности распределения.
Примечания:
- В качестве аргумента функции можно передавать ссылку на ячейку с числовыми данными или само число. Функция ФИ автоматические преобразует логические значения и текстовые строки, содержащие числа, к числовым значениям.
- Если аргумент функции принимает данные, не преобразуемые к числовым значениям, результатом выполнения ФИ будет код ошибки #ЗНАЧ!
- Для больших значений, значение плотности вероятности которых стремится к нулю, функция возвращает число 0. Например, =ФИ(100) вернет число 0.
Свойства
Гауссовы функции возникают путем составления экспоненциальной функции с вогнутой квадратичной функцией
- ф(Икс)знак равноопыт(αИкс2+βИкс+γ),{\ Displaystyle е (х) = \ ехр (\ альфа х ^ {2} + \ бета х + \ гамма),}
где
- αзнак равно−12с2,{\ Displaystyle \ альфа = -1/2с ^ {2},}
- βзнак равнобс2,{\ Displaystyle \ бета = б / с ^ {2},}
- γзнак равнопа−(б22с2).{\ displaystyle \ gamma = \ ln a- (b ^ {2} / 2c ^ {2}).}
Таким образом, функции Гаусса — это функции, логарифм которых является вогнутой квадратичной функцией.
Параметр c относится к полной ширине на половине высоты (FWHM) пика в соответствии с
- ПШПМзнак равно22п2с≈2.35482с.{\ displaystyle {\ text {FWHM}} = 2 {\ sqrt {2 \ ln 2}} \, c \ приблизительно 2,35482 \, c.}
Затем функция может быть выражена через FWHM, представленную w
- ф(Икс)знак равноае−4(п2)(Икс−б)2ж2.{\ displaystyle f (x) = ae ^ {- 4 (\ ln 2) (xb) ^ {2} / w ^ {2}}.}
В качестве альтернативы параметр c можно интерпретировать, говоря, что две точки перегиба функции возникают при x = b ± c .
Полная ширина в десятых долях максимума (FWTM) для гауссиана может представлять интерес и
- FWTMзнак равно22п10с≈4.29193с.{\ displaystyle {\ text {FWTM}} = 2 {\ sqrt {2 \ ln 10}} \, c \ приблизительно 4,29193 \, c.}
Гауссовы функции являются аналитическими , и их предел при x → ∞ равен 0 (для приведенного выше случая b = 0 ).
Гауссовы функции относятся к числу функций, которые являются элементарными , но не имеют элементарных первообразных ; интеграл от функции Гаусса есть функция ошибок . Тем не менее их несобственные интегралы по всей вещественной линии можно точно вычислить, используя интеграл Гаусса
- ∫−∞∞е−Икс2гИксзнак равноπ,{\ displaystyle \ int _ {- \ infty} ^ {\ infty} e ^ {- x ^ {2}} \, dx = {\ sqrt {\ pi}},}
и один получает
- ∫−∞∞ае−(Икс−б)2(2с2)гИксзнак равноас⋅2π.{\ displaystyle \ int _ {- \ infty} ^ {\ infty} ae ^ {- (xb) ^ {2} / (2c ^ {2})} \, dx = ac \ cdot {\ sqrt {2 \ pi }}.}
Нормализованные кривые Гаусса с математическим ожиданием μ и дисперсией σ 2 . Соответствующие параметрыазнак равно1о2π{\ displaystyle a = {\ tfrac {1} {\ sigma {\ sqrt {2 \ pi}}}}}, b = μ и c = σ .
Этот интеграл равен 1 тогда и только тогда, когда азнак равно1с2π{\ displaystyle a = {\ tfrac {1} {c {\ sqrt {2 \ pi}}}}}( нормирующая постоянная ), и в этом случае гауссиана является функцией плотности вероятности нормально распределенной случайной величины с ожидаемым значением µ = b и дисперсией σ 2 = c 2
- г(Икс)знак равно1о2πопыт(−(Икс−мю)22о2).{\ displaystyle g (x) = {\ frac {1} {\ sigma {\ sqrt {2 \ pi}}}} \ exp \ left ({\ frac {- (x- \ mu) ^ {2}} { 2\сигма ^{2}}}\справа).}
Эти гауссианы изображены на прилагаемом рисунке.
Гауссовы функции с центром в нуле минимизируют Фурье .
Произведение двух функций Гаусса является гауссианом, и свертка двух функций Гаусса также является гауссианом, причем дисперсия представляет собой сумму исходных дисперсий:с2знак равнос12+с22{\ Displaystyle с ^ {2} = с_ {1} ^ {2} + с_ {2} ^ {2}}. Однако произведение двух функций плотности вероятности Гаусса (PDF) в общем случае не является гауссовской функцией плотности вероятности.
Выполнение функции Гаусса с параметрами a = 1 , b = 0 и c дает другую функцию Гаусса с параметрамис{\ Displaystyle с}, b = 0 и1с{\ Displaystyle 1 / с}. Так, в частности, функции Гаусса с b = 0 исзнак равно1{\ Displaystyle с = 1}фиксируются преобразованием Фурье (они являются собственными функциями преобразования Фурье с собственным значением 1). Физической реализацией является : например, фотографический слайд , коэффициент пропускания которого имеет гауссову вариацию, также является гауссовой функцией.
Тот факт, что функция Гаусса является собственной функцией непрерывного преобразования Фурье, позволяет нам вывести следующее интересное требуется уточнение тождество из формулы суммирования Пуассона
- ∑кеZопыт(−π⋅(кс)2)знак равнос⋅∑кеZопыт(−π⋅(кс)2).{\ displaystyle \ sum _ {k \ in \ mathbb {Z}} \ exp \ left (- \ pi \ cdot \ left ({\ frac {k} {c}} \ right) ^ {2} \ right) = c\cdot \sum _{k\in \mathbb {Z}}\exp \left(-\pi \cdot (kc)^{2}\right).}
Дискретный гауссовский
Дискретное ядро Гаусса (сплошная линия ) по сравнению с дискретным ядром Гаусса (штриховая линия) для масштабовтзнак равно0,5,1,2,4.{\ Displaystyle т = 0,5,1,2,4.}
Можно попросить дискретный аналог гауссиана; это необходимо в дискретных приложениях, особенно в цифровой обработке сигналов . Простой ответ состоит в том, чтобы взять непрерывную гауссиану и получить дискретизированное гауссово ядро . Однако эта дискретная функция не имеет дискретных аналогов свойств непрерывной функции и может привести к нежелательным эффектам, как описано в статье Реализация масштабного пространства .
Альтернативный подход заключается в использовании дискретного ядра Гаусса
- Т(н,т)знак равное−тян(т){\ Displaystyle Т (п, т) = е ^ {- т} I_ {п} (т)}
где ян(т){\ Displaystyle I_ {п} (т)}обозначает модифицированные функции Бесселя целого порядка.
Это дискретный аналог непрерывного гауссиана в том смысле, что он является решением дискретного уравнения диффузии (дискретное пространство, непрерывное время), точно так же, как непрерывный гауссиан является решением уравнения непрерывной диффузии.
Нормальное распределение. Построение графика в Excel. Концепция шести сигм
Наверное, не все знают, что в Excel есть встроенная функция для построения нормального распределения. Графики нормального распределения часто используются для демонстрации идей статистической обработки данных.
Функция НОРМРАСП имеет следующий синтаксис:
НОРМРАСП (Х; среднее; стандартное_откл; интегральная)
Х — аргумент функции; фактически НОРМРАСП можно трактовать как y=f(x); при этом функция возвращает вероятность реализации события Х
Среднее (µ) — среднее арифметическое распределения; чем дальше Х от среднего, тем ниже вероятность реализации такого события
Стандартное_откл (σ) — стандартное отклонение распределения; мера кучности; чем меньше σ, тем выше вероятность у тех Х, которые расположены ближе к среднему
Интегральная — логическое значение, определяющее форму функции. Если «интегральная» имеет значение ИСТИНА, функция НОРМРАСП возвращает интегральную функцию распределения, тот есть суммарную вероятность всех событий для аргументов от -∞ до Х; если «интегральная» имеет значение ЛОЖЬ, возвращается вероятность реализации события Х, точнее говоря, вероятность событий находящихся в некотором диапазоне вокруг Х
Например, для µ=0 имеем:
Скачать заметку в формате Word, пример в формате Excel
Здесь по оси абсцисс единица измерения – σ, или (что то же самое), можно сказать, что график построен для σ = 1. То есть, «-2» на графике означает -2σ. По оси ординат шкала убрана умышленно, так как она лишена смысла. Точнее говоря, высота кривой зависит от плотности точек на оси абсцисс, по которым мы строим график. Например, если на интервал от 0 до 1σ приходится 10 точек, то высота в максимуме составит 4%, а если 20 точек – 2%. Здесь проценты означают вероятность попадания случайной величины в узкий диапазон окрестности точки на оси абсцисс. Зато имеет смысл площадь под кривой на определенном интервале. И эта площадь не зависит от плотности точек. Так, например, площадь под кривой на интервале от 0 до 1σ составляет 34,13%. Это значение можно интерпретировать следующим образом: с вероятностью 68,26% случайная величина Х попадет в диапазон µ ± σ.
Теперь, наверное, вам будет лучше понятен смысл выражения «качество шести сигм». Оно означает, что производство налажено таким образом, что случайная величина Х (например, диаметр вала) находясь в диапазон µ ± 6σ, всё еще удовлетворяет техническим условиям (допускам). Это достигается за счет значительного уменьшения сигмы, то есть случайная величина Х очень близка к нормативному значению µ. На графике ниже представлено три ситуации, когда границы допуска остаются неизменными, а благодаря повышению качества (уменьшению вариабельности, сужению сигма) доля брака сокращается:
На первом рисунке только 1,5σ попадают в границы допуска, то есть только 86,6% деталей являются годными. На втором рисунке уже 3σ попадают в границы допуска, то есть 99,75% являются годными. Но всё еще 25 деталей из каждых 10 000 произведенных являются браком. На третьем рисунке целых 6σ попадают в границы допуска, то есть в брак попадут только две детали на миллиард изготовленных!
Вообще-то говоря, измерение качества в терминах сигм использует не совсем нормальное распределение. Вот что пишет на эту тему Википедия:
Опыт показывает, что показатели процессов имеют тенденцию изменяться с течением времени. В результате со временем в промежуток между границами поля допуска будет входить меньше, чем было установлено первоначально. Опытным путём было установлено, что изменение параметров во времени можно учесть с помощью смещения в 1,5 сигма. Другими словами, с течением времени длина промежутка между границами поля допуска под кривой нормального распределения уменьшается до 4,5 сигма вследствие того, что среднее процесса с течением времени смещается и/или среднеквадратическое отклонение увеличивается.
Широко распространённое представление о «процессе шесть сигма» заключается в том, что такой процесс позволяет получить уровень качества 3,4 дефектных единиц на миллион готовых изделий при условии, что длина под кривой слева или справа от среднего будет соответствовать 4,5 сигма (без учёта левого или правого конца кривой за границей поля допуска). Таким образом, уровень качества 3,4 дефектных единиц на миллион готовых изделий соответствует длине промежутка 4,5 сигма, получаемых разницей между 6 сигма и сдвигом в 1,5 сигма, которое было введено, чтобы учесть изменение показателей с течением времени. Такая поправка создана для того, чтобы предупредить неправильною оценку уровня дефектности, встречающееся в реальных условиях.
С моей точки зрения, не вполне внятное объяснение. Тем не менее, во всем мире принята следующая таблица соответствия числа дефектов и уровня качества в сигмах:
Интеграл от функции Гаусса
Интеграл произвольной функции Гаусса равен
- ∫−∞∞ае−(Икс−б)22с2гИксзнак равно2а|с|π.{\ displaystyle \ int _ {- \ infty} ^ {\ infty} a \, e ^ {- (xb) ^ {2} / 2c ^ {2}} \, dx = {\ sqrt {2}} a \ ,|c|\,{\sqrt {\pi}}.}
Альтернативная форма
- ∫−∞∞ке−фИкс2+гИкс+часгИксзнак равно∫−∞∞ке−ф(Икс−г(2ф))2+г2(4ф)+часгИксзнак равнокπфопыт(г24ф+час),{\ displaystyle \ int _ {- \ infty} ^ {\ infty} k \, e ^ {- fx ^ {2} + gx + h} \, dx = \ int _ {- \ infty} ^ {\ infty} k \, e ^ {- f {\ big (} xg / (2f) {\ big)} ^ {2} + g ^ {2} / (4f) + h} \, dx = k \, {\ sqrt {\ frac {\ pi} {f}}} \, \ exp \ left ({\ frac {g ^ {2}} {4f}} + h \ right),}
где f должно быть строго положительным, чтобы интеграл сходился.
Связь со стандартным интегралом Гаусса
Интеграл
- ∫−∞∞ае−(Икс−б)22с2гИкс{\ displaystyle \ int _ {- \ infty} ^ {\ infty} ae ^ {- (xb) ^ {2} / 2c ^ {2}} \, dx}
для некоторых действительных констант a , b , c > 0 можно вычислить, представив его в виде интеграла Гаусса . Во-первых, константу а можно просто вынести из интеграла. Далее переменная интегрирования меняется с x на y = x − b
- а∫−∞∞е−у22с2гу,{\ displaystyle a \ int _ {- \ infty} ^ {\ infty} e ^ {- y ^ {2} / 2c ^ {2}} \, dy,}
а затем гзнак равноу2с2{\ displaystyle z = y / {\ sqrt {2c ^ {2}}}}
- а2с2∫−∞∞е−г2гг.{\ displaystyle a {\ sqrt {2c ^ {2}}} \ int _ {- \ infty} ^ {\ infty} e ^ {- z ^ {2}} \, dz.}
Тогда, используя интегральное тождество Гаусса
- ∫−∞∞е−г2ггзнак равноπ,{\ displaystyle \ int _ {- \ infty} ^ {\ infty} e ^ {- z ^ {2}} \, dz = {\ sqrt {\ pi}},}
у нас есть
- ∫−∞∞ае−(Икс−б)22с2гИксзнак равноа2πс2.{\ displaystyle \ int _ {- \ infty} ^ {\ infty} ae ^ {- (xb) ^ {2} / 2c ^ {2}} \, dx = a {\ sqrt {2 \ pi c ^ {2 }}}.}