Использование функции MEDIAN в Microsoft Excel
В Excel есть несколько функций, которые рассчитывают часто используемые средние значения. Функция MEDIAN находит медиану или среднее значение в списке чисел.
Примечание . Эти инструкции относятся к Excel 2019, 2016, 2013, 2010, Excel 2019 для Mac, Excel 2016 для Mac, Excel для Mac 2011, Excel для Office 365 и Excel Online.
Как работает функция MEDIAN
Функция MEDIAN сортирует предоставленные аргументы, чтобы найти значение, которое арифметически падает в середине группы.
Если существует нечетное количество аргументов, функция идентифицирует среднее значение в диапазоне как среднее значение.
Если имеется четное число аргументов, функция принимает среднее арифметическое или среднее из двух средних значений.
аргументы
Значения, предоставляемые в качестве аргументов, не обязательно должны быть в каком-то определенном порядке для работы функции. Вы можете увидеть это в игре в четвертом ряду на примере изображения ниже.
MEDIAN Синтаксис функции
Синтаксис функции относится к макету функции и включает имя функции, скобки, разделители запятых и аргументы.
Ниже приведен синтаксис для функции MEDIAN:
= MEDIAN ( Number1 , Number2 , Number3 , ... )
- = MEDIAN . Все формулы MEDIAN начинаются таким образом.
- Number1 Обязательные данные, которые должны быть рассчитаны функцией.
- Number2 Необязательные дополнительные значения данных для расчета в среднем. Максимально допустимое количество записей – 255, каждая из которых должна быть разделена запятой.
Этот аргумент может содержать:
- Список чисел для усреднения
- Ячейки ссылаются на расположение данных на листе
- Диапазон ссылок на ячейки
- Именованный диапазон
Варианты ввода функции и ее аргументов:
- Ввод полной функции, например = MEDIAN (A2: F2) , в ячейку листа
- Ввод функции и аргументов с использованием диалогового окна функции
Пример функции MEDIAN
Эти шаги подробно описывают, как ввести функцию MEDIAN и аргументы, используя диалоговое окно для первого примера, показанного на изображении выше.
- Нажмите на ячейку G2 , где будут отображаться результаты.
- Нажмите кнопку Вставить функцию , чтобы открыть диалоговое окно «Вставить функцию».
- Выберите Статистический в списке категорий.
- Выберите MEDIAN в списке функций и нажмите ОК .
- Выделите ячейки от A2 до F2 на листе, чтобы автоматически вставить этот диапазон.
- Нажмите Enter , чтобы завершить функцию и вернуться к рабочему листу.
Ответ 20 должен появиться в ячейке G2
Если щелкнуть ячейку G2, полная функция = MEDIAN (A2: F2) появится в строке формул над рабочим листом.
Почему медиана 20? Для первого примера в изображении, поскольку существует нечетное количество аргументов (пять), среднее значение вычисляется путем нахождения среднего числа. Здесь 20, потому что есть два числа больше (49 и 65) и два числа меньше (4 и 12).
Пустые ячейки против нулевых значений
При нахождении медианы в Excel, есть разница между пустыми или пустыми ячейками и теми, которые содержат нулевое значение.
Как показано в приведенных выше примерах, функция MEDIAN игнорирует пустые ячейки, но не ячейки, содержащие нулевое значение.
- Медиана изменяется между первым и вторым примерами, потому что в ячейку A3 был добавлен ноль, а ячейка A2 пуста.
- Добавление ноля к ячейке A3 изменяет число аргументов, передаваемых функции в ячейке G3, с пяти до шести – четное число. В результате медиана рассчитывается путем сложения двух средних значений (12 и 20) вместе, а затем деления на два, чтобы найти их среднее значение (16).
По умолчанию Excel отображает ноль (0) в ячейках с нулевым значением, как показано в примере выше. Эту опцию можно отключить, и, если это будет сделано, такие ячейки останутся пустыми, но нулевое значение для этой ячейки все еще будет включено в качестве аргумента функции при вычислении медианы.
Примечание . Этот параметр нельзя отключить в Excel Online.
Как включить или отключить этот параметр в Excel 2019, Excel 2016, Excel 2013 и Excel 2010 :
- Перейдите на вкладку Файл и нажмите Параметры .
- Перейдите в категорию Дополнительно на левой панели параметров.
- На правой стороне прокручивайте вниз, пока не найдете раздел Параметры отображения для этого рабочего листа .
- Чтобы скрыть нулевые значения в ячейках, снимите флажок Показать ноль в ячейках с нулевым значением . Чтобы отобразить нули, поставьте галочку в поле.
- Сохраните любые изменения с помощью кнопки ОК .
Как включить или отключить этот параметр в Excel 2019 для Mac, Excel 2016 для Mac и Excel для Mac 2011 :
- Перейдите в меню Excel .
- Нажмите Настройки .
- Нажмите Вид в разделе «Авторизация».
- Снимите флажок Показать нулевые значения в разделе Параметры окна .
Расчет децилей для дискретного ряда
-
Определяем номер дециля по формуле: ,
-
Если номер дециля – целое число, то значение дециля будет равно величине элемента ряда, которое обладает накопленной частотой равной номеру дециля. Например, если номер дециля равен 20, его значение будет равно значению признака с S =20 (накопленной частотой равной 20).
Если номер дециля – нецелое число, то дециль попадает между двумя наблюдениями. Значением дециля будет сумма, состоящая из значения элемента, для которого накопленная частота равна целому значению номера дециля, и указанной части (нецелая часть номера дециля) разности между значением этого элемента и значением следующего элемента.
Например, если номер дециля равна 20,25, дециль попадает между 20-м и 21-м наблюдениями, и его значение будет равно значению 20-го наблюдения плюс 1/4 разности между значением 20-го и 21-го наблюдений.
Среднее, Медиана и Мода
Среднее (mean) это статистическое значение среднего значения, например, средним для 4,5,6 будет 5. Как рассчитать среднее значение в Excel? =average(число1,число2 и т.д.)
Mean=AVERAGE(AC16:AC21)
Путем вычисления среднего мы определяем, сколько мы продали в среднем. Эта информация полезна, если нет экстремальных значений (или выбросов). Почему?
Например, мы продали в среднем товаров на $3000, но на самом деле нам повезло, т.к. 6 сентября покупатели потратили больше. В предыдущие шесть дней товара было куплено в среднем лишь на $618. Исключив крайние значения от среднего, можно получить более репрезентативные даные.
Медиана (median) это значение, которое делит набор данных на две равные части. Например, для набора данных 224, 298, 304 медианой является — 298. Для того чтобы вычислить среднее для большого набора данных, можно использовать следующую формулу =MEDIAN(224,298,304).
Когда может пригодиться медиана? Медиана полезна, когда у вас есть неравномерное распределение, например, цена ваших конфет варьируется от $3 до $15 за упаковку, но также у вас есть очень дорогие конфеты за $100, которые покупают редко. В конце месяца вы делаете отчет, и вы видите, что вы продали в основном дешевые конфеты и только пару упаковок за $100. В этом случае вам будет полезен расчет медианы.
Самый простой способ понять, когда лучше использовать медиану и среднее, это построение гистограммы. Если ваша гистограмма сильно смещена до экстримальных значений, значит нужно рассчитывать медиану.
Мода (mode) самое распространенное значение, например, мода для: 4,6,7,7,7,7,9,10 это 7.
Рассчитать моду в Excel вы можете с помощью формулы =MODE(4,6,7,7,7,7,9,10).
Но имейте в виду, что Excel выдает за моду наименьшее значение из возможных. Например, вы рассчитываете моду для следующего набора данных: 2,2,2,4,5,6,7,7,7,8,9, сразу отметим, что здесь две моды — 2 и 7, но Excel покажет вам только наименьшее значение — 2.
Когда можно использовать функцию моды? Расчет моды полезен только для целых чисел, например 1, 2 и 3. И нежелателен для дробных чисел, таких как 1,744; 2,443; 3,323, т.к. числа могут дублироваться.
Критерии Стьюдента
Для оценки статистической значимости модели по параметрам рассчитывают t-критерии Стьюдента.
Оценка значимости модели с помощью критерия Стьюдента проводится путем сравнения их значений с величиной случайной ошибки:
Случайные ошибки коэффициентов линейной регрессии и коэффициента корреляции определяются по формулам:
Сравнивая фактическое и табличное значения t-статистики и принимается или отвергается гипотеза о значимости модели по параметрам.
Зависимость между критерием Фишера и значением t-статистики Стьюдента определяется так
Как и в случае с оценкой значимости уравнения модели в целом, модель считается ненадежной если tтабл > tфакт
Порядок расчета критерия φ*
1. Формулируем статистические гипотезы:
Но: доля студентов, получивших оценки 4 и 5 до эксперимента такая же, как и после эксперимента;
Н1: доля студентов, получивших оценки 4 и 5 после эксперимента больше, чем до эксперимента.
2. Определяем значения углов φ1 и φ2, соответствующие долям p1 = 0,666; p2 = 0,888
φ1= 2arcsin (√p1)= 2 arcsin √0,6662 arcsin (0,816)= 2·0.954=1.908
φ2= 2arcsin (√p2)= 2 arcsin √0,888=2 arcsin (0,942)= 2·1.228=2.457
3. Вычисляем эмпирическое значение φ по формуле.
4. Сравниваем эмпирическое значение критерия с критическим (представлено в таблице 2)
Таблица 2. Критические значения критерия при различных значениях уровнях значимости α (Попов Г.И. с соавт., 2007).
α | критические значения критерия φ* |
0,001 | 2,91 |
0,01 | 2,31 |
0,05 | 1,64 |
0,1 | 1,29 |
Расчет в программе Excel
В программу введен контрольный пример. В верхней части программы показано, как должны быть представлены исходные данные в случае связанных выборок (слева) и в случае независимых выборок (справа).
Чтобы выполнить расчет, нужно заполнить клетки, выделенные желтым цветом в нижней части таблицы. После этого будет получено эмпирическое значение критерия (фи*эмп). Затем подученное значение эмпирического значения фи нужно сравнить с критическим значением (фи* крит) на заданном уровне значимости. Эти значения приведены в табл.1. Если фи*эмп больше чем фи*крит, различия между группами статистически достоверны.
Медиана в EXCEL
Для вычисления медианы в MS EXCEL существует специальная функция МЕДИАНА() . В этой статье дадим определение медианы и научимся вычислять ее для выборки и для заданного закона распределения случайной величины.
Начнем с медианы для выборок (т.е. для фиксированного набора значений).
Медиана выборки
Медиана (median) – это число, которое является серединой множества чисел: половина чисел множества больше, чем медиана , а половина чисел меньше, чем медиана .
Для вычисления медианы необходимо сначала отсортировать множество чисел (значения в выборке ). Например, медианой для выборки (2; 3; 3; 4 ; 5; 7; 10) будет 4. Т.к. всего в выборке 7 значений, три из них меньше, чем 4 (т.е. 2; 3; 3), а три значения больше (т.е. 5; 7; 10).
Если множество содержит четное количество чисел, то вычисляется среднее для двух чисел, находящихся в середине множества. Например, медианой для выборки (2; 3; 3 ; 6 ; 7; 10) будет 4,5, т.к. (3+6)/2=4,5.
Для определения медианы в MS EXCEL существует одноименная функция МЕДИАНА() , английский вариант MEDIAN().
Медиана не обязательно совпадает со средним значением (mean, average) в выборке . Совпадение имеет место только в том случае, если значения в выборке распределены симметрично относительно среднего . Например, для выборки (1; 2; 3 ; 4 ; 5; 6) медиана и среднее равны 3,5.
Чтобы в этом убедиться — построим гистограмму для симметричной выборки, состоящую из 36 значений, и вычислим среднее и медиану (см. файл примера лист Медиана-выборка ).
В чем же ценность медианы ? Почему ее используют зачастую наравне со средним значением ?
Оба параметра используются для определения «центральной тенденции» выборки . Для выборки с несимметричным распределением, медиана будет отличаться от среднего . Например, для (1; 2; 3 ; 4 ; 5; 600) медиана равна 3,5, а вот среднее равно 103,5 (смещено в сторону б о льшего значения).
То есть, если имеется длинный хвост распределения, то медиана лучше, чем среднее значение, отражает «типичное» или «центральное» значение. Например, рассмотрим пример несправедливого распределения зарплат в компании, в которой руководство получает существенно больше, чем основная масса сотрудников (также см. статью Описательная статистика , раздел Медиана ).
Очевидно, что средняя зарплата (71 тыс. руб.) не отражает тот факт, что 86% сотрудников получает не более 30 тыс. руб. (т.е. 86% сотрудников получает зарплату в более, чем в 2 раза меньше средней!). В то же время медиана (15 тыс. руб.) показывает, что как минимум у половины сотрудников зарплата меньше или равна 15 тыс. руб.
Примечание : Так как медиана является 50-й процентилью и 2-й квартилью , ее также можно вычислить с помощью формул =ПРОЦЕНТИЛЬ.ВКЛ( Выборка;0,5 ) и =КВАРТИЛЬ.ВКЛ( Выборка;2 ) , где Выборка – это ссылка на диапазон, содержащий значения выборки.
Если выборка содержит нечетное количество чисел, то для вычисления медианы можно также воспользоваться формулой: НАИБОЛЬШИЙ(Выборка;СЧЁТ(Выборка)/2) .
Медиана непрерывного распределения
Если Функция распределения F (х) случайной величины х непрерывна, то медиана является решением уравнения F(х) =0,5.
Примечание : подробнее о Функции распределения см. статью Функция распределения и плотность вероятности в MS EXCEL .
Если известна Функция распределения F(х) или функция плотности вероятности p (х) , то медиану можно найти из уравнения:
Например, решив аналитическим способом это уравнение для Логнормального распределения lnN(μ; σ 2 ), получим, что медиана вычисляется по формуле =EXP(μ). При μ=0, медиана равна 1.
Обратите внимание на точку Функции распределения , для которой F (х)=0,5 (см. картинку выше)
Абсцисса этой точкиравна1. Это и есть значение медианы, что естественно совпадает с ранее вычисленным значением по формуле em.
В MS EXCEL медиану для логнормального распределения LnN(0;1) можно вычислить по формуле =ЛОГНОРМ.ОБР(0,5;0;1) .
Примечание : Напомним, что интеграл от функции плотности вероятности по всей области задания случайной величины равен единице.
Поэтому, линия медианы (х=Медиана) делит площадь под графиком функции плотности вероятности на две равные части.
Примечание : В статье о распределениях MS EXCEL приведены ссылки на распределения для которых в MS EXCEL существуют специальные функции ( нормальное распределение , гамма-распределение , Экспоненциальное и др.). Используя эти функции можно вычислить медиану соответствующего распределения.
Функция МЕДИАНА в Excel для выполнения статистического анализа
Функция МЕДИАНА в Excel используется для анализа диапазона числовых значений и возвращает число, которое является серединой исследуемого множества (медианой). То есть, данная функция условно разделяет множество чисел на два подмножества, первое из которых содержит числа меньше медианы, а второе – больше. Медиана является одним из нескольких методов определения центральной тенденции исследуемого диапазона.
Примеры использования функции МЕДИАНА в Excel
Пример 1. При исследовании возрастных групп студентов использовались данные случайно выбранной группы учащихся в ВУЗе. Задача – определить срединный возраст студентов.
Формула для расчета:
B3:B15 – диапазон исследуемых возрастов.
То есть в группе есть студенты, возраст которых меньше 21 года и больше этого значения.
Сравнение функций МЕДИАНА и СРЗНАЧ для вычисления среднего значения
Пример 2. Во время вечернего обхода в больнице каждому больному была замерена температура тела. Продемонстрировать целесообразность использования параметра медиана вместо среднего значения для исследования ряда полученных значений.
Формула для нахождения среднего значения:
Формула для нахождения медианы:
Как видно из показателя среднего значения, в среднем температура у пациентов выше нормы, однако это не соответствует действительности. Медиана показывает, что как минимум у половины пациентов наблюдается нормальная температура тела, не превышающая показатель 36,6.
Внимание! Еще одним методом определения центральной тенденции является мода (наиболее часто встречающееся значение в исследуемом диапазоне). Чтобы определить центральную тенденцию в Excel следует использовать функцию МОДА. Обратите внимание: в данном примере значения медианы и моды совпадают:
Обратите внимание: в данном примере значения медианы и моды совпадают:
То есть срединная величина, делящая одно множество на подмножества меньших и больших значений также является и наиболее часто встречающимся значением в множестве. Как видно, у большинства пациентов температура составляет 36,6.
Пример расчета медианы при статистическом анализе в Excel
Пример 3. В магазине работают 3 продавца. По результатам последних 10 дней необходимо определить работника, которому будет выдана премия. При выборе лучшего работника учитывается степень эффективности его работы, а не число проданных товаров.
Исходная таблица данных:
Для характеристики эффективности будем использовать сразу три показателя: среднее значение, медиана и мода. Определим их для каждого работника с использованием формул СРЗНАЧ, МЕДИАНА и МОДА соответственно:
Для определения степени разброса данных используем величину, которая является суммарным значением модуля разницы среднего значения и моды, среднего значения и медианы соответственно. То есть коэффициент x=|av-med|+|av-mod|, где:
- av – среднее значение;
- med – медиана;
- mod – мода.
Рассчитаем значение коэффициента x для первого продавца:
Аналогично проведем расчеты для остальных продавцов. Полученные результаты:
Определим продавца, которому будет выдана премия:
Примечание: функция НАИМЕНЬШИЙ возвращает первое минимальное значение из рассматриваемого диапазона значений коэффициента x.
Коэффициент x является некоторой количественной характеристикой стабильности работы продавцов, которую ввел экономист магазина. С его помощью удалось определить диапазон с наименьшими отклонениями значений. Этот способ демонстрирует, как можно использовать сразу три метода определения центральной тенденции для получения наиболее достоверных результатов.
Вычислительные методы
Дискретные распределения
Для дискретных распределений не существует единого мнения о выборе значений квартилей.
Метод 1
-
Используйте медианное значение, чтобы разделить упорядоченный набор данных на две половины.
- Если в исходном упорядоченном наборе данных есть нечетное количество точек данных, не включайте медиану (центральное значение в упорядоченном списке) ни в одну из половин.
- Если в исходном упорядоченном наборе данных есть четное количество точек данных, разделите этот набор данных ровно пополам.
- Значение нижнего квартиля — это медиана нижней половины данных. Значение верхнего квартиля — это медиана верхней половины данных.
Это правило используется в функции boxplot калькулятора TI-83 и «1-Var Stats».
Метод 2
-
Используйте медианное значение, чтобы разделить упорядоченный набор данных на две половины.
- Если в исходном упорядоченном наборе данных есть нечетное количество точек данных, включите медиану (центральное значение в упорядоченном списке) в обе половины.
- Если в исходном упорядоченном наборе данных четное количество точек данных, разделите этот набор данных ровно пополам.
- Значение нижнего квартиля — это медиана нижней половины данных. Значение верхнего квартиля — это медиана верхней половины данных.
Значения, найденные этим методом, также известны как « петли Тьюки »; см. Также midhinge .
Метод 3
- Если имеется четное количество точек данных, то метод 3 такой же, как и любой из описанных выше методов.
- Если имеется (4 n +1) точек данных, то нижний квартиль составляет 75% от n- го значения данных плюс 25% от ( n +1) -го значения данных; верхний квартиль составляет 75% от (3 n +1) -й точки данных плюс 25% от (3 n +2) -ой точки данных.
- Если имеется (4 n +3) точек данных, то нижний квартиль составляет 75% от ( n +1) -го значения данных плюс 25% от ( n +2) -го значения данных; верхний квартиль составляет 25% от (3 n +2) -й точки данных плюс 75% от (3 n +3) -й точки данных.
Метод 4
Если у нас есть упорядоченный набор данных Икс1,Икс2,...,Иксп{\ displaystyle x_ {1}, x_ {2}, …, x_ {n}}, мы можем интерполировать между точками данных, чтобы найти п{\ displaystyle p}й эмпирический квантиль, еслиИкся{\ displaystyle x_ {i}} находится в я(п+1){\ Displaystyle я / (п + 1)}квантиль. Если обозначить целую часть числаа{\ displaystyle a} к а{\ Displaystyle }, то эмпирическая функция квантиля определяется выражением
q(п)знак равноИкс(k)+α(Икс(k+1)—Икс(k)){\ Displaystyle д (п) = х _ {(к)} + \ альфа (х _ {(к + 1)} — х _ {(к)})},
куда kзнак равноп(п+1){\ Displaystyle к = } а также αзнак равноп(п+1)—п(п+1){\ Displaystyle \ альфа = п (п + 1) — }.
Чтобы найти первый, второй и третий квартили набора данных, мы оценили бы q(0,25){\ displaystyle q (0,25)}, q(0,5){\ displaystyle q (0,5)}, а также q(0,75){\ displaystyle q (0,75)} соответственно.
Пример 1
Заказанный набор данных: 6, 7, 15, 36, 39, 40, 41, 42, 43, 47, 49
Способ 1 |
Способ 2 |
Способ 3 |
Метод 4 |
|
---|---|---|---|---|
Q 1 | 15 |
25,5 |
20,25 |
15 |
2 квартал | 40 |
40 |
40 |
40 |
3 квартал | 43 год |
42,5 |
42,75 |
43 год |
Пример 2
Заказанный набор данных: 7, 15, 36, 39, 40, 41
Поскольку имеется четное количество точек данных, все первые три метода дают одинаковые результаты.
Способ 1 |
Способ 2 |
Способ 3 |
Метод 4 |
|
---|---|---|---|---|
Q 1 | 15 |
15 |
15 |
13 |
2 квартал | 37,5 |
37,5 |
37,5 |
37,5 |
3 квартал | 40 |
40 |
40 |
40,25 |
Непрерывные распределения вероятностей
Квартили на кумулятивной функции распределения нормального распределения
Если мы определим непрерывное распределение вероятностей какп(Икс){\ Displaystyle P (X)} куда Икс{\ displaystyle X}является случайной величиной с действительным знаком , ее кумулятивная функция распределения (CDF) определяется выражением,
FИкс(Икс)знак равноп(Икс≤Икс){\ Displaystyle F_ {X} (х) = P (X \ Leq x)}.
CDF дает вероятность того, что случайная величинаИкс{\ displaystyle X} меньше значения Икс{\ displaystyle x}. Следовательно, первый квартиль — это значениеИкс{\ displaystyle x} когда FИкс(Икс)знак равно0,25{\ Displaystyle F_ {X} (х) = 0,25}, второй квартиль Икс{\ displaystyle x} когда FИкс(Икс)знак равно0,5{\ Displaystyle F_ {X} (х) = 0,5}, а третий квартиль — Икс{\ displaystyle x} когда FИкс(Икс)знак равно0,75{\ Displaystyle F_ {X} (х) = 0,75}. ЗначенияИкс{\ displaystyle x}можно найти с помощью функции квантиля Q(п){\ displaystyle Q (p)}куда пзнак равно0,25{\ displaystyle p = 0,25} для первого квартиля, пзнак равно0,5{\ displaystyle p = 0,5} для второго квартиля, и пзнак равно0,75{\ displaystyle p = 0,75}для третьего квартиля. Функция квантиля является обратной к кумулятивной функции распределения, если кумулятивная функция распределения монотонно возрастает .
Примеры использования функций КВАРТИЛЬ в Excel
Пример 1. В столбце таблицы содержится числовая последовательность. Определить число, которое делит последовательность на 2 части, 25% первой – числа меньше полученного значения, а 75% — больше. Использовать N+1-интерполяцию.
Вид таблицы данных:
Для определения 1-го квартиля используем функцию:
- A2:A15 – диапазон ячеек с исследуемыми числами;
- 1 – номер вычисляемого квартиля.
Проверим утверждение о том, что второй квартиль соответствует медиане выборке. Определим 2-й по формуле:
Полученные значения совпадают:
В результате расчетов мы получили первый, второй квартили и медиану для исходного диапазона чисел.
Определение коэффициента эластичности
1. Задача по статистике – Коэффициент эластичности.
Для данного товара коэффициент эластичности k эл = -0,5.
Как изменится потребление этого товара, если цены на него возрастут на 10%?
Коэффициент эластичности – это отношение процентного изменения спроса к процентному изменению цены.
Следовательно процентное изменение спроса = k эл*процентное изменение цены=
=-0,5*10=5%. То есть потребление снизится на 5%.
Найти децильный коэффициен, моду и медианну по следующим данным.
Средний доход, руб. / (чел. мес)
Количество человек, млн. чел
Накопленная частота, млн. чел
Мода рассчитывается по формуле:
Где
Модальный интервал определяется по наибольшей частоте. Наибольшая частота в данной задаче 31,3, что соответствует интервалу от 4000 до 6000 рублей.
=4000+2000*(31,3-30,6) / (( 31,3-30,6)-( 31,3-25,3))=4209 рублей.
Таким образом самый частый доход 4209 рублей.
Медианна рассчитывается по формуле:
Где
Медианный интервал определяется по накопленной частоте. Суммируются f частоты до тех пор, пока очередная накопленная частота не превысит середину совокупности. В данной задаче совокупность состоит из 147,5 млн человек. Поэтому суммируем f частоты пока не превысим 147,5 /2=7 3,75 млн человек. Это произойдет в интервале от 6000 до 8000 руб, поскольку накопленная частота данного интервала равна 87.2, т.е. больше половины совокупности.
Следовательно интервал от 6000 до 8000 руб является медианным интервалом. Накопленная частота интервала, предшествующего медианному, равна 61,9.
=6000+2000*(0,5*147,5-61,9) /2 5,3 = 6937 руб. / мес.
Значит половина людей в совокупности имеет доход менее 6937 рублей, а половина более 6937 рублей.
Расчет децильного коэффициента
Рассчитаем дециль №1 (10% совокупности).
Таким образом, дециль №1 входит в 1-й интервал с доходом до 4000.
Дециль рассчитывается по формуле:
Где
Рассчитаем первый дециль
=0+4000*(14,75-0) / 30,6 = 1928 рублей.
Рассчитаем дециль №9 (90% совокупности).
Рассчитаем девятый дециль
=16000+4000*(132,75-132,6) /7= 16086 рублей.
Децильный коэффициент рассчитывается по формуле
Таким образом, минимальный доход 10% самого богатого населения в 8,4 раза выше, чем максимальный доход 10% самого бедного населения.
Расчет децилей для дискретного ряда
-
Определяем номер дециля по формуле: ,
-
Если номер дециля – целое число, то значение дециля будет равно величине элемента ряда, которое обладает накопленной частотой равной номеру дециля. Например, если номер дециля равен 20, его значение будет равно значению признака с S =20 (накопленной частотой равной 20).
Если номер дециля – нецелое число, то дециль попадает между двумя наблюдениями. Значением дециля будет сумма, состоящая из значения элемента, для которого накопленная частота равна целому значению номера дециля, и указанной части (нецелая часть номера дециля) разности между значением этого элемента и значением следующего элемента.
Например, если номер дециля равна 20,25, дециль попадает между 20-м и 21-м наблюдениями, и его значение будет равно значению 20-го наблюдения плюс 1/4 разности между значением 20-го и 21-го наблюдений.