Дисперсионный анализ

Как сделать факторный анализ в excel

5 этапов факторного анализа

Вне зависимости от выбранной методики последовательность действия при факторном анализе и совершении расчетов будет примерно одинаковой:

Сначала отберите все факторы, влияние которых необходимо установить

На этом этапе важно подобрать источники информации – в первую очередь это данные из бухгалтерской отчетности, однако допускается использовать и другие сведения.
Классифицируйте эти факторы, если их слишком много. Группировка может быть любой, в зависимости от целей исследования – например, по издержкам, по макроэкономическим показателям, сезонности и т.п.
Проведите расчеты по влиянию каждого из факторов в отдельности.
Установите взаимосвязи (при наличии корреляции) между разными факторами.
Сделайте количественные и качественные выводы на основе проведенного анализа.

Метод абсолютных разниц

Этот способ применяется для моделей, где рассматривается произведение влияния фактора на конечный результат хозяйственной деятельности. То есть, он используется для моделей аддитивного и мультпликативно-аддитивного вида. Несмотря на то, что область его применения ограничена, он активно применяется в анализе экономической работы субъектов. Оценка проводится путем умножения абсолютного значения прироста на плановое расчетное значение. Таким образом, появляется возможность рассмотреть влияние одного фактора. Значение всех остальных факторов принимается как фактическое и неизменяемое, а последующих факторов в виде базиса.

Расчет воздействия начинается с первого фактора, далее строго соблюдается последовательность влияния факторов. Рассмотрим на примере мультипликативной модели:

  1. $Y (a) = a • b_0 • c_0$, фактор $а$ рассматривается в динамике его изменения, остальные факторы исследуются в их базисном значении.
  2. $Y(b) = a_1 • b • c_0$, то есть рассматриваемый фактор $b$ берется в динамике, предыдущий фактор a оценивается по его фактическому значению, а последующий фактор c по базисному.
  3. $Y (c) = a_1 • b_1 • c$, здесь соблюдается тот же принцип, что и вышеуказанных моделях.

Индексный метод оценки влияния факторов оперирует относительными величинами. Он помогает получить более точное представление о воздействии факторов, так как каждый фактор в его фактическом значении делится на его базисное значение, что позволяет рассчитать индекс. С помощью индексов можно охарактеризовать исследуемое явление во времени и пространстве.

Наиболее часто в экономике используют три вида индексов, а именно, индекс Ласпейреса или индекс фактического товарооборота. Агрегатный индекс цен или индекс Паше широко применяется для оценки динамики цен и зависимости производственного выпуска. Индексы позволяют анализировать влияние факторов в том случае, если оно представлено их произведением.

Интегральный метод является наиболее точным из существующих. Он полностью убирает эффект преувеличения влияния одного фактора, и преуменьшения влияния другого. Это происходит из-за того, что факторы оказывают взаимное влияние, а значит, образуют совместный прирост итогового значения.

Все рассмотренные методы факторного анализа работают для оценки количественного влияния факторов. При этом, исследование сложных факторов подразумевает, что они будут разбиты на более простые составляющие, а затем, элементы будут проанализированы по отдельности. В этом случае, разделенные факторы будут относится ко второму уровню, который рассчитывается с помощью метода долевого участия.

Этот способ представляет собой разбивку факторов на несколько уровней. Чтобы рассчитать факторы второго порядка проводится оценка динамики их прироста. Причем анализируется их доля в общей сумме прироста. Затем осуществляется их умножение на величину влияния совокупного раскладываемого фактора.

Применение методов детерминированного факторного анализа требует соблюдения условий, позволяющих избегать элиминирования. Оно предполагает, что изменение факторов происходит не зависимо друг от друга, когда в реальности все факторы, как правило, оказывают взаимное влияние. Прирост изменения итога обычно происходит по показателю, анализируемому в последнюю очередь

При исследовании модели очень важно учитывать эту особенность, так как месторасположения фактора в цепочке воздействия может влиять на общий результат и влияние других факторов. Помимо приведенных методов, все чаще используются интегральный метод, метод логарифмический, кольцевой, экстремальный и метод взвешенных конечных разностей

Таким образом, детерминированный факторный анализ и его методы позволяют оценивать влияние факторов на конечный результат. Он широко применяется при анализе хозяйственной деятельности отдельных субъектов хозяйствования и целых систем

Важно помнить, что ни одна структура не является закрытой, а значит, всегда подвержена воздействию других систем, событий, явлений и объектов. При этом сам предмет исследования может оказывать влияние на окружающую среду

Кроме того, детерминированный факторный анализ помогает рассматривать экономические показатели в динамике, что позволяет приблизить исследование к реальности.

Факторный анализ в Excel: пример

Факторным называют многомерный анализ взаимосвязей между значениями переменных. С помощью данного метода можно решить важнейшие задачи:

  • всесторонне описать измеряемый объект (причем емко, компактно);
  • выявить скрытые переменные значения, определяющие наличие линейных статистических корреляций;
  • классифицировать переменные (определить взаимосвязи между ними);
  • сократить число необходимых переменных.

Рассмотрим на примере проведение факторного анализа. Допустим, нам известны продажи каких-либо товаров за последние 4 месяца. Необходимо проанализировать, какие наименования пользуются спросом, а какие нет.

  1. Посмотрим, за счет, каких наименований произошел основной рост по итогам второго месяца. Если продажи какого-то товара выросли, положительная дельта – в столбец «Рост». Отрицательная – «Снижение». Формула в Excel для «роста»: =ЕСЛИ((C2-B2)>0;C2-B2;0), где С2-В2 – разница между 2 и 1 месяцем. Формула для «снижения»: =ЕСЛИ(J3=0;B2-C2;0), где J3 – ссылка на ячейку слева («Рост»). Во втором столбце – сумма предыдущего значения и предыдущего роста за вычетом текущего снижения.
  2. Рассчитаем процент роста по каждому наименованию товара. Формула: =ЕСЛИ(J3/$I$11=0;-K3/$I$11;J3/$I$11). Где J3/$I$11 – отношение «роста» к итогу за 2 месяц, ;-K3/$I$11 – отношение «снижения» к итогу за 2 месяц.
  3. Выделяем область данных для построения диаграммы. Переходим на вкладку «Вставка» — «Гистограмма».
  4. Поработаем с подписями и цветами. Уберем накопительный итог через «Формат ряда данных» — «Заливка» («Нет заливки»). С помощью данного инструментария меняем цвет для «снижения» и «роста».

Теперь наглядно видно, продажи какого товара дают основной рост.

Факторный анализ предприятия. Определение. Цели. Виды

Факторный анализ относится в научной литературе к разделу многомерного статистического анализа, где оценку наблюдаемых переменных проводят с помощью ковариационных или корреляционных матриц.

Факторный анализ впервые стал применяться в психометрике и в настоящее время используется почти во всех науках начиная от психологии и кончая нейрофизиологией и политологией. Основные концепции факторного анализа были определены английским психологом Гальтоном и затем развиты Спирменом, Терстоуном, Кеттелом.

Можно выделить 2 цели факторного анализа
:
— определение взаимосвязи между переменными (классификация).
— сокращение числа переменных (кластеризация).

Факторный анализ предприятия
– комплексная методика системного изучения и оценки воздействия факторов на величину результативного показателя.

Можно выделить следующие виды факторного анализа
:

  1. Функциональный, где результативный показатель определен в виде произведения или алгебраической суммы факторов.
  2. Корреляционный (стохастический) – связь между результативным показателем и факторами являются вероятностой.
  3. Прямой / Обратный – от общего к частном и наоборот.
  4. Одноступенчатый/многоступенчатый.
  5. Ретроспективный/ перспективный.

Остановимся на первых двух более подробно.

Для того, чтобы можно было провести факторный анализ необходимо
:
— Все факторы должны быть количественными.
— Число факторов в 2 раза больше чем результативные показатели.
— Однородная выборка.
— Нормальное распределение факторов.

Факторный анализ
осуществляется в несколько этапов:
1 этап. Отбираются факторы.
2 этап. Факторы классифицируются и систематизируются.
3 этап. Моделируется взаимосвязь между результативным показателем и факторами.
4 этап. Оценка влияния каждого фактора на результативный показатель.
5 этап. Практическое использование модели.

Выделяются методы детерминированного факторного анализа и методы стохастического факторного анализа.

Детерминированный факторный анализ
– исследование, в котором факторы влияют на результативный показатель функционально. Методы детерминированного факторного анализа – метод абсолютных разниц, метод логарифмирования, метод относительных разниц. Данный вид анализ наиболее распространен в силу своей простоты применения и позволяет понять факторы, которые необходимо изменить для увеличения / уменьшения результативного показателя.

Стохастический факторный анализ
– исследование, в котором факторы влияют на результативный показатель вероятностно, т.е. при изменении фактора может быть несколько значений (или диапазон) результирующего показателя. Методы стохастического факторного анализа – теория игр, математическое программирование, множественный корреляционный анализ, матричные модели.

Факторный анализ прибыли позволяет оценить влияние каждого фактора в отдельности на финансовый результат в целом. Читайте, как его провести, а также скачайте методику проведения.

Предварительные сведения

Оценка параметров системы

В качестве примера систем, оценка параметров которых актуальна с практической точки зрения, могут служить различные технологические процессы. Для иллюстрации рассмотрим процесс фотолитографии.

Итак, технологический процесс фотолитографии описывается некоторой функцией вида

Построение модели технологического процесса позволяет выявить поведение отклика системы в зависимости от изменения факторов и тем самый найти пути для оптимизации технологии. Для данного конкретного случая — выбрать такую толщину эмульсии и время экспозиции, которые обеспечат наилучшее качество изображения.

В общем случае отклик системы описывается некоторой функцией n переменных

Математическая модель системы получается в результате апроксимации этой функции какой-либо другой функцией, например линейной

Матрица эксперимента

Предположим, исходные параметры технологического процесса составляют: толщина плёнки 55 мкм, время экспозиции — 30 с, то есть

Возьмём верхние и нижние значения обоих факторов так, чтобы они располагались симметрично относительно текущего значения, например

Составим таблицу, в которой значения обоих факторов находятся во всех возможных сочетаниях и проведём измерения в этих точках (значения отклика даны условно):

на основании полученных результатов можно составить систему четырёх уравнений с двумя переменными. Ниже показана эта система, а также её сокращённая запись в виде матрицы. Матрицу данного вида назовём матрицей эксперимента.

В матрице эксперимента второй и третий столбцы представляют собой значения факторов, четвёртый столбец — значения отклика системы, а первый столбец содержит единицы, соответствующие единичным коэффициентам свободного члена модели a 0

Решение системы

Чтобы облегчить решение системы, проведём нормировку факторов. Верхним значениям факторов присвоим нормированное значение +1, нижним значениям — нормированное значение −1, среднему значению — нормированное значение 0. В общем виде нормировка фактора выражается формулой

С учётом нормировки факторов система уравнений и матрица эксперимента примут следующий вид:

Поскольку сумма членов во втором и третьем столбце матрицы равны нулю, свободный член модели можно найти, сложив все четыре уравнения:

Чтобы найти какой-либо другой коэффициент модели, нужно изменить знаки в уравнениях таким образом, чтобы в соответствующем столбце оказались одни единицы, после чего сложить все четыре уравнения:

Таким образом, линейная модель технологического процесса в окрестностях точки (55, 30) имеет вид

В общем случае решение системы будет выглядеть как

Возврат к ненормированным факторам

Переход от нормированных к ненормированным факторам осуществляется обратным преобразованием

Чтобы найти параметры модели для ненормированных координат, подставим выражения для нормированных координат в уравнение модели:

Сравнивая последнее выражение с выражением для линейной модели в ненормированных координатах

Окончательно получаем модель в естественных координатах:

8.5.1 Полный факторный эксперимент: В полном факторном эксперименте (ПФЭ) для каждого фактора выбирается
Для планирования эксперимента был использован ПФЭ типа 2 3 , который позволил оценить все линейные эффекты и все их взаимодействия. Матрица планирования и результаты экспериментов приведены в табл. 8.2.

Выполним детерминированный факторный анализ на примере модели, описывающей связь финансовых показателей предприятия. Рассмотрим наиболее общий способ цепных подстановок. Для проведения факторного анализа используем надстройкуMSEXCELVarianceAnalysisToolот компанииFincontrollex.

Двухфакторный дисперсионный анализ с повторениями: суть метода, формулы, пример

Двухфакторный дисперсионный анализ с повторениями применяется для того, чтобы проверить
не только возможную
зависимость результативного признака от двух факторов — A и B, но и возможное
взаимодействие факторов A и B. Тогда
a — число градаций фактора A и b — число градаций фактора B, r —
число повторений. В
статистическом комплексе сумма квадратов остатков разделяется на четыре компоненты:

,

где

— общая сумма квадратов отклонений,

— объяснённая
влиянием фактора сумма квадратов отклонений,

— объяснённая
влиянием фактора сумма квадратов отклонений,

— объяснённая
влиянием взаимодействия факторов и сумма квадратов отклонений,

— необъяснённая сумма
квадратов отклонений или сумма квадратов отклонений ошибки,


общее среднее наблюдений,


среднее наблюдений в каждой градации фактора ,


среднее число наблюдений в каждой градации фактора ,


среднее число наблюдений в каждой комбинации градаций факторов
и ,

— общее число наблюдений.

Дисперсии вычисляются следующим образом:


дисперсия, объяснённая влиянием фактора ,


дисперсия, объяснённая влиянием фактора ,


дисперсия, объяснённая взаимодействием факторов и ,


необъяснённая дисперсия или дисперсия ошибки,

где


число степеней свободы дисперсии, объяснённой влиянием фактора ,


число степеней свободы дисперсии, объяснённой влиянием фактора ,


число степеней свободы дисперсии, объяснённой взаимодействием факторов и ,


число степеней свободы необъяснённой дисперсии или дисперсии ошибки,


общее число степеней свободы.

Если факторы не зависят друг от друга, то для определения существенности факторов
выдвигаются три нулевые гипотезы и соответствующие альтернативные гипотезы:

для фактора :

,

: не все равны;

для фактора :

,

: не все равны;

для взаимодействия факторов и :

,

: ABij ≠ 0
для всех i и j.

Чтобы определить влияние фактора , нужно
фактическое отношение Фишера
сравнить с критическим отношением Фишера .

Чтобы определить влияние фактора , нужно
фактическое отношение Фишера
сравнить с критическим отношением Фишера .

Чтобы определить влияние взаимодействия факторов и
, нужно
фактическое отношение Фишера
сравнить с критическим отношением Фишера .

Если фактическое отношение Фишера больше критического отношения Фишера, то следует
отклонить нулевую гипотезу с уровнем значимости . Это означает,
что фактор существенно влияет на данные: данные зависят от фактора с вероятностью
.

Если фактическое отношение Фишера меньше критического отношения Фишера, то следует
принять нулевую гипотезу с уровнем значимости . Это означает,
что фактор не оказывает существенного влияния на данные с вероятностью
.

Двухфакторный дисперсионный анализ с повторениями: пример

Пример 4. Торговое предприятие имеет три магазина —
, и .
Проводятся две рекламные кампании. Требуется выяснить, зависят ли средние дневные доходы магазинов от
двух рекламных кампаний. Для процедуры проверки случайно выбраны по 3 дня каждой рекламной кампании
(то есть число повторений ). Результаты обобщены
в таблице:

Рекламная кампания Магазин
Рекламная кампания 1 12,05
23,94
14,63
Рекламная кампания 2 25,78
17,52
18,45
Среднее 18,73
Магазин Магазин Среднее
15,17 9,48 14,53
18,52 6,92
19,57 10,47
21,40 7,63 15,86
13,59 11,90
20,57 5,92
18,14 8,72

Факторы, подлежащие проверке: магазин (, и )
и рекламная кампания (1 и 2). Пусть эти факторы не зависят друг от друга.

Вычислим суммы квадратов отклонений:

,

,

,

.

Числа степеней свободы:

,

,

,

,

.

Дисперсии:

,

,

,

.

Фактические отношения Фишера:

для фактора :

для фактора :

для взаимодействия факторов и :
.

Критические значения отношения Фишера:

для фактора : ,

для фактора :

для взаимодействия факторов и :
.

Делаем выводы:

о влиянии фактора : фактическое отношение Фишера
меньше критического значения, следовательно, рекламная кампания существенно не влияет на дневные доходы магазина с вероятностью 95%,

о влиянии фактора : фактическое отношение Фишера
больше критического, следовательно, доходы существенно различаются между магазинами,

о взаимодействии факторов и :
фактическое отношение Фишера меньше критического, следовательно, взаимодействие рекламной кампании и конкретного
магазина не существенно.

Двухфакторный дисперсионный анализ в Excel

Показывает, как влияет два фактора на изменение значения случайной величины. Рассмотрим двухфакторный дисперсионный анализ в Excel на примере.

Задача. Группе мужчин и женщин предъявляли звук разной громкости: 1 – 10 дБ, 2 – 30 дБ, 3 – 50 дБ. Время ответа фиксировали в миллисекундах. Необходимо определить, влияет ли пол на реакцию; влияет ли громкость на реакцию.

Называют факторным анализом . Основными разновидностями факторного анализа являются детерминированный анализ и стохастический анализ.

Детерминированный факторный анализ основывается на методике изучения влияния таких факторов, взаимосвязь которых с обобщающим экономическим показателем является функциональной. Последнее означает, что обобщающий показатель представляет собой либо произведение, либо частное от деления, либо алгебраическую сумму отдельных факторов.

Стохастический факторный анализ основывается на методике исследования влияния таких факторов, взаимосвязь которых с обобщающим экономическим показателем является вероятностной, иначе — корреляционной.

В условиях наличия функциональной взаимосвязи с изменением аргумента всегда имеет место и соответствующе изменение функции. При наличии же вероятностной взаимосвязи изменение аргумента может сочетаться с несколькими значениями изменения функции.

Факторный анализ подразделяется также на прямой , иначе дедуктивный анализ и обратный (индуктивный) анализ.

Первый вид анализа осуществляет изучение влияния факторов дедуктивным методом, то есть в направлении от общего к частному. При обратном факторном анализе влияние факторов исследуется индуктивным методом — в направлении от частных факторов к обобщающим экономическим показателям.

Классификация факторов, влияющих на эффективности деятельности организации

Факторы, влияние которых изучается при проведении , классифицируются по различным признакам. Прежде всего их можно подразделить на два основных вида: внутренние факторы , зависящие от деятельности данной , и внешние факторы , не зависящие от данной организации.

В зависимости от длительности их воздействия на экономические показатели можно выделить постоянные и переменные факторы . Первый вид факторов оказывает влияние на экономические показатели, которое не ограничено во времени. Переменные факторы воздействуют на экономические показатели лишь в течение определенного периода времени.

Факторы можно подразделить также в зависимости от сферы их действия на факторы неограниченного и факторы ограниченного действия. Первый вид факторов действует повсеместно, в любых отраслях народного хозяйства. Второй вид факторов оказывает влияние лишь внутри какой-либо отрасли или даже отдельной организации.

По своей структуре факторы подразделяются на простые и сложные. Подавляющая часть факторов — сложные, включающие в себя несколько составных частей. Вместе с тем имеются и такие факторы, которые не поддаются расчленению. Например, фондоотдача может служить примером сложного фактора. Количество дней, отработанных оборудованием за данный период является простым фактором.

В зависимости от того, можно ли дать количественную оценку влияния данного фактора на обобщающий экономический показатель, различают измеряемые и неизмеряемые факторы.

Эта классификация тесно взаимосвязана с классификацией резервов повышения эффективности хозяйственной деятельности организаций, или, иначе говоря, резервов улучшения анализируемых экономических показателей.

Детерминированный факторный анализ

Суть факторного анализа

Суть факторного метода в том, чтобы определить влияние каждого фактора в отдельности на результат в целом. Это достаточно сложно сделать, так факторы влияют друг на друга, а если фактор не количественный (например, сервис), то его вес оценивают экспертным путем, что накладывает на весь анализ отпечаток субъективности. Кроме того, когда факторов влияющих на результат становится слишком много, то данные невозможно обрабатывать и рассчитывать без специальных программ математического моделирования.

Одним из самых главных финансовых показателей предприятия является прибыль. В рамках факторного анализа лучше анализировать маржинальную прибыль, где постоянные расходы отсутствуют, либо прибыль от продаж.

Вычисления в MS Excel. Тема 2. Однофакторный дисперсионный анализ

Тема 2. Однофакторный дисперсионный анализ

Вариант 1. Однофакторный дисперсионный анализ

Задание: при уровне значимости 0,05, установить значимость влияния фактора А методом однофакторного дисперсионного анализа. Дать интерпретацию фактору и его уровню, а также результирующему показателю в терминах экономических величин.

Уровни фактора А Номер испытания 1 2 3 4
а1 а2 а3 а4 12 17 13 11 14 13 14 12 10 11 14 13 13 9 8 9

Вариант 2. Однофакторный дисперсионный анализ

Задание: при уровне значимости 0,05, установить значимость влияния фактора А методом однофакторного дисперсионного анализа. Дать интерпретацию фактору и его уровню, а также результирующему показателю в терминах экономических величин.

Уровни фактора А Номер испытания 1 2 3 4
а1 а2 а3 100 101 126 128 92 102 104 115 74 87 88 93

Вариант 10. Однофакторный дисперсионный анализ

Задание: при уровне значимости 0,05, установить значимость влияния фактора А методом однофакторного дисперсионного анализа. Дать интерпретацию фактору и его уровню, а также результирующему показателю в терминах экономических величин.

Уровни фактора А Номер испытания 1 2 3 4
а1 а2 а3 а4 8 8 11 9 12 11 7 6 14 13 12 9 10 15 8 7

Вариант 11. Однофакторный дисперсионный анализ

Задание: при уровне значимости 0,05, установить значимость влияния фактора А методом однофакторного дисперсионного анализа. Дать интерпретацию фактору и его уровню, а также результирующему показателю в терминах экономических величин.

Уровни фактора А Номер испытания 1 2 3 4
а1 а2 а3 а4 18 18 22 29 32 31 37 36 44 43 52 49 50 55 60 57

Вариант 14. Однофакторный дисперсионный анализ

Задание: при уровне значимости 0,05, установить значимость влияния фактора А методом однофакторного дисперсионного анализа. Дать интерпретацию фактору и его уровню, а также результирующему показателю в терминах экономических величин.

Уровни фактора А Номер испытания 1 2 3 4
а1 а2 а3 а4 12 14 15 11 15 17 20 22 20 16 19 23 33 29 24 27

Вычисления в MS Excel

Пример. Известны итоговые результаты в баллах 20 студентов по дисциплине «Теория вероятностей и математическая статистика». Требуется установить, влияет ли базовое (среднее) образование на успеваемость студента.

Уровни фактора А – базовое (среднее) образование студента Номер испытания
Гимназия или лицей
Школа с углубленным изучением предметов
Обычная школа
Техникум

Решение. Заносим исходные данные в MS Excel, как в таблице.

Рис. 2.4. Выбор однофакторного дисперсионного анализа

Рис. 2.5. Ввод данных для расчета однофакторного дисперсионного анализа

После проделанных расчетов можно выполнить проверку результата с помощью пакета анализа (пункт меню «Данные», затем выбираем «пакет анализа») (рис. 2.4.).

При введении данных в раздел пакет анализа «однофакторный дисперсионный анализ» необходимо обратить внимание на расположение исходных данных в строках или столбцах (рис. 2.5)

Для расчетов входной интервал выделяем вместе с названиями уровней фактора, не забывая при этом поставить отметку в графе «метки в первом столбце». Когда все данные правильно введены, нажимаем кнопку «ОК» и переходим на тот лист, на который будут выведены результаты расчетов (рис. 2.6).

По рис. 2.6. видно, что все результаты, сделанные вручную, совпадают с результатами, рассчитанными автоматически. Таким образом, они верны.

Рис. 2.6. Результаты расчетов значений критерия Фишера с помощью пакета анализа

Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Студалл.Орг (0.005 сек.)

21.1 Тестирование значимости нулевой гипотезы в ANOVA.

Как и в случае с другими статистическими тестами, мы можем выделить 4 этапа в тестировании значимости нулевой гипотезы в ANOVA:

  1. Формулирование нулевой и альтернативной гипотезы. Нулевая гипотеза говорит, что между средними в генеральной совокупности нет различий:

\ Можно было бы предположить, что ненулевая гипотеза звучит как “все средние не равны”, но вообще-то это не так. Альтернативная гипотеза в дисперсионном анализе звучит так:

\

  1. Подсчет статистики. Как мы уже видели раньше, в дисперсионном анализе используется новая для нас статистика F. Впрочем, мы ее видели, когда смотрели на аутпут функции , когда делали линейную регрессию. Чтобы считать F (если вдруг мы хотим сделать это вручную), нужно построить талбицу ANOVA (ANOVA table).
Таблица ANOVA Степени свободы Суммы квадратов Средние квадраты F-статистика
Межгрупповые \(df_{b}\) \(SS_{b}\) \(MS_{b} =\frac{SS_{b}}{df_{b}}\) \(F=\frac{MS_{b}}{MS_{w}}\)
Внутригрупповые \(df_{w}\) \(SS_{w}\) \(MS_{w} =\frac{SS_{w}}{df_{w}}\)
Общие \(df_{t}\) \(SS_{t}= SS_{b} + SS_{w}\)

Именно эту таблицу мы видели, когда использовали функцию :

Вот как это все считается:

Таблица ANOVA Степени свободы Суммы квадратов Средние квадраты F-статистика
Между \(df_{b}=J-1\) \(SS_{b}= \sum\limits_{j=1}^J \sum\limits_{i=1}^{n_j} (\overline{x_j}-\overline{x})^2\) \(MS_{b} =\frac{SS_{b}}{df_{b}}\) \(F=\frac{MS_{b}}{MS_{w}}\)
Внутри \(df_{w}=N-J\) \(SS_{w}= \sum\limits_{j=1}^J \sum\limits_{i=1}^{n_j} (x_{ij}-\overline{x_j})^2\) \(MS_{w} =\frac{SS_{w}}{df_{w}}\)
Общие \(df_{t}=N-1\) \(SS_{t}= \sum\limits_{j=1}^J \sum\limits_{i=1}^{n_j} (x_{ij}-\overline{x})^2\)

\(J\) означает количество групп, \(N\) — общее количество наблюдений во всех группах, \(n_j\) означает количество наблюдений в группе j, а \(x_{ij}\) — наблюдение под номером \(i\) в группе \(j\).

Вариабельность обозначается \(SS\) и означает “сумму квадратов” (sum of squares) — это то же, что и дисперсия, только мы не делим вме в конце на количество наблюдений (или количество наблюдений минус один): \

Здесь много формул, но суть довольно простая: мы разделяем вариабельность зависимой переменной на внутригрупповую и межгрупповую, считаем их соотношение, которое и будет F. В среднем, F будет равен 1 при верности нулевой гипотезы. Это означает, что и межгрупповая вариабельность, и внутригрупповая вариабельность — это просто шум. Но если же межгрупповая вариабельность — это не просто шум, то это соотношение будет сильно больше единицы.

  1. Подсчет p-value. В t-тесте мы смотрели, как статистика распределена при условии верности нулевой гипотезы. То есть что будет, если нулевая гипотеза верна, мы будем повторять эксперимент с точно таким же дизайном (и размером выборок) бесконечное количество раз и считать F.

Заметьте, распределение F несимметричное. Это значит, что мы всегда считаем считаем площадь от F до плюс бесконечности (без умножения на 2, как мы это делали в t-тесте):

Это и есть наш p-value!

  1. Сравнение p-value с уровнем \(\alpha\). Самый простой этап: если наш p-value меньше, чем \(\alpha\) (который обычно равен 0.05), то мы отвергаем нулевую гипотезу. Если нет — не отвергаем.

Факторный анализ прибыли от продаж

Евгений Шагин
, финансовый директор УК «РусЧерМет»

Чтобы провести факторный анализ, необходимо:

  • выбрать базу для анализа – выручка от продаж, прибыль;
  • отобрать факторы, влияние которых необходимо оценить. В зависимости от выбранной базы анализа ими могут быть: объем продаж, себестоимость, операционные расходы, внереализационные доходы, проценты за кредит, налоги;
  • оценить влияние каждого фактора на итоговый показатель. В базовый расчет по предыдущему периоду подставить значение выбранного фактора из отчетного периода и скорректировать итоговый показатель с учетом этих изменений;
  • определить влияние фактора. Вычесть из полученного промежуточного значения оцениваемого показателя его фактическое значение за предыдущий период. Если цифра положительная, изменение фактора оказало позитивное влияние, отрицательная – негативное.

Пример факторного анализа прибыли от продаж

Рассмотрим на примере. В отчет о финансовых результатах компании «Альфа» за предыдущий период подставим значение объема продаж за текущий период (571 513 512 руб. вместо 488 473 087 руб.), все остальные показатели останутся прежними (см. таблицу 5). Как результат, чистая прибыль увеличилась на 83 040 425 руб. (116 049 828 руб. – 33 009 403 руб.). Это означает, что если бы в предыдущем периоде компании удалось реализовать продукцию на ту же сумму, что и в этом, то ее чистая прибыль выросла бы как раз на эти 83 040 425 руб.

Таблица 5
. Факторный анализ прибыли по объему продаж

Показатель

Предыдущий период, руб.

с подстановкойзначенияфактора изтекущегопериода

Объем продаж

Валовая прибыль

Операционные расходы

Операционная прибыль

Проценты за кредит

Прибыль до налогообложения

Чистая прибыль

1 Значение объема продаж за текущий период.

2 Показатель пересчитан с учетом корректировки объема продаж.

По аналогичной схеме можно оценить влияние каждого фактора и пересчитать чистую прибыль, а итоговые результаты свести в одну таблицу (см. таблицу 6).

Таблица 6
. Влияние факторов на прибыль, руб.

Объем продаж

Себестоимость реализованной продукции, услуг

Операционные расходы

Внереализационные доходы/расходы

Проценты за кредит

Итого

32 244 671

Как видно из таблицы 6, наибольшее влияние в анализируемом периоде оказал рост продаж (83 040 425 руб.). Сумма влияния всех факторов совпадает с фактическим изменением прибыли за прошедший период. Отсюда можно сделать вывод о корректности результатов анализа.

Однофакторный дисперсионный анализ в Excel

Однофакторный дисперсионный анализ изучает влияния одного фактора на анализируемый признак.

В таблицы приведены статистические данные по количеству изготовленных деталей на заводе каждым мастером в течение каждой недели.

Необходимо выяснить зависимость количества изготовленных деталей от производительности мастера. Уровень значимости равен α=0.05.

№ п/п Номер недели Количество изготовленных деталей
Первым мастером Вторым мастером Третьим мастером Четвертым мастером Пятым мастером
1. Первая неделя 260 253 258 257 251
2. Вторая неделя 257 255 255 252 250
3. Третья неделя 259 250 254 253 255
4. Четвёртая неделя 254 254 260 257 251

Переходим на вкладку Данные -> Анализ данных. Выбираем однофакторный дисперсионный анализ и жмём Ок.

Появляется окно, здесь во входном интервале выбираем диапазон данный в нашей таблицы в нашем случае это диапазон ячеек $C$3:$G$6, альфа ставим 0,05 (обычно в Excel данная величина стоит по умолчанию) и в выходном интервале указываем произвольную ячейку на листе Excel, где желаете, чтобы отобразился результат, далее Ок.

В результате получим решение в виде таблицы.

Однофакторный дисперсионный анализ
ИТОГИ
Группы Счет Сумма Среднее Дисперсия
Столбец 1 4 1030 257,5 7
Столбец 2 4 1012 253 4,666666667
Столбец 3 4 1027 256,75 7,583333333
Столбец 4 4 1019 254,75 6,916666667
Столбец 5 4 1007 251,75 4,916666667
Дисперсионный анализ
Источник вариации SS df MS F P-Значение F критическое
Между группами 94,5 4 23,625 3,800268097 0,025089214 3,055568276
Внутри групп 93,25 15 6,21666667
Итого 187,75 19

Из таблицы значения F-критерия равно Fнабл=3.8, а Fкрит=3, правосторонний интервал (3; +∞) Fнабл>Fкрит, отсюда следует, что Fнабл лежит в этом интервале, следовательно, нулевую гипотезу H о равенстве групповых матожиданий — отвергаем, следовательно фактор — количества изготовленных деталей зависит от признака — производительности мастера.

Найдём выборочный коэффициент детерминации:

Этот показатель говорит о том, что около половины еженедельного количества изготовленных деталей мастерами связано с номером недели.

Насколько публикация полезна?

Нажмите на звезду, чтобы оценить!

Средняя оценка 4.3 / 5. Количество оценок: 6

Понравилась статья? Поделиться с друзьями:
Самоучитель Брин Гвелл
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: