Свойства дисперсии.

Доказано - для экономистов работа с числами очень важный навык. Игоровой тренажер "Продолжи ряд" создан специально для работы с числами в уме. В начале обучения только 2 из 10 проходят тест без ошибок.

Пройти тест

Свойства дисперсии.

1. Дисперсия постоянной величины равна 0.

.

2. Если из каждой варианты отнять постоянное число А, то значение дисперсии не изменится. Уменьшение всех значений признака на одну и ту же величину А не меняет величины дисперсии:

.

Значит, средний квадрат отклонений можно вычислить не по заданным значениям признака, а по отклонениям их от какого-то постоянного числа.

3. Если все значения признака разделить на какое-то постоянное число А, то дисперсия уменьшится в А2 раз. Уменьшение всех значений признака в А раз уменьшает дисперсию в А2 раз, а среднее квадратическое отклонение – в А раз.

Значит, все значения признака можно разделить на какое-то постоянное число (скажем, на величину интервала ряда), исчислить среднее квадратическое отклонение, а затем умножить его на постоянное число:

.

4. Если исчислить средний квадрат отклонений от любой величины А, которая отличается от средней арифметической , тогда он будет больше среднего квадрата отклонения σ2, исчисленной от средней арифметической:

Средний квадрат отклонений при этом будет больше на вполне определенную величину – на квадрат разности средней и этой условно взятой величины, т.е. на :

, или .

Обоснование:

Если A=0, тогда

Таким образом:

Значит, дисперсия от средней всегда меньше дисперсий, исчисленных от любых других величин, т.е. она имеет свойство минимальности.

Если воспользоваться 3 и 4 свойствами, то получим формулу (способ моментов):

где m1, m2 – моменты первого и второго порядков соответственно, А – центральное значение (величина) варианта, i – величина интервала.

Пример. Расчет дисперсии способом моментов.

Распределение предприятий по объему товарооборота.

Группы предприятий по объему товарооборота, млн. руб.

Число предприятий (f)

Середина интервала (x)

x*f

60-80

21

70

 

-2

-42

84

80-100

27

90

 

-1

-27

27

100-120

24

110

 

0

0

0

120-140

16

130

 

1

16

16

140-160

8

150

 

2

16

32

160-180

4

170

 

3

12

36

Всего:

100

     

-25

195

i=20 млн. руб.

Среднее квадратическое отклонение играет важную роль в анализе рядов распределения. В условиях нормального распределения существует следующая зависимость между величиной среднего квадратического отклонения и количеством наблюдений:

- в пределах  располагается 0,683, или 68,3%, количество наблюдений;

-  - 0,954, или 95,4%, количества наблюдений;

- в пределах  - 0,997, или 99,7%, количества наблюдений.

В действительности на практике почти не встречаются отклонения, которые превышают . Отклонение  может считаться максимально возможным. Это положение называют «правилом трех сигм».

Виды дисперсий, правила сложения дисперсий.

Для того, чтобы определить влияние отдельных факторов, характеризующих колеблемость индивидуальных значений признака, нужно разделить изучаемую совокупность на группы, однородные по признаку-фактору.

При этом можно определить три вида дисперсии:

- общая дисперсия;

- межгрупповая дисперсия;

- внутригрупповая дисперсия.

Общая дисперсия (σ2) измеряет вариацию признака по всей совокупности под влиянием всех факторов:

Межгрупповая дисперсия ()отражает вариацию изучаемого признака, которая возникает под влиянием признака-фактора, положенного в основу группировки. Она характеризует колеблемость групповых средних  около общей средней :

, где ni – численности отдельных групп.

Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации, происходящей под влиянием неучтенных факторов и независящую от признака фактора, положенного в основание группировки. Она исчисляется следующим образом:

Определим среднюю из внутригрупповых дисперсий:

Общая дисперсия, межгрупповая дисперсия и средняя из внутригрупповых дисперсий связаны между собой следующим соотношением:

Данное соотношение называется правилом сложения дисперсий. Согласно этому правилу, общая дисперсия, возникающая под действием всех факторов, равна сумме дисперсии, появляющейся под влиянием всех прочих факторов, и дисперсии, возникающей за счет группировочного признака. Широко применяется при исчислении показателей тесноты связи, дисперсионном анализе и в других случаях.

Показатель, представляющий собой долю межгрупповой дисперсии, называется эмпирическим коэффициентом детерминации:

Этот коэффициент показывает долю общей вариации изучаемого признака, обусловленную вариацией группировочного признака.

Эмпирическое корреляционное отношение:

, где  0≤η≤1.

Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака.

Если η=0, то группировочный признак не оказывает влияние на результативный. Если η=1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки.

 

Квантили.

Рис. Ранжирование ряда распределения.

В вариационном ряду распределения кроме медианы можно определить квартили, децили и процентили, которые получили общее название квантили.

Квартили представляют собой значение признака, делящее ранжированную совокупность на четыре равновеликие части. Первый квартиль (нижний квартиль) Q1, отделяющий одну четвертую часть совокупности, с наименьшими значениями признака. Q2 – средний квартиль, медиана, делящая ранжированную совокупность пополам. Q3 – верхний квартиль, отделяющий одну четвертую часть совокупности с наибольшими значениями признака.

Децили – варианты, делящие совокупность на 10 равных частей. Первый дециль D1 отделяет от начала совокупности одну десятую часть ряда с наименьшими значениями признака. Второй дециль отделяет две десятые ряда. Перцентили – варианты, которые делят совокупность на сто равных частей. Они используются для детального изучения структуры вариационного ряда.