На данной странице описан стандартный пример нахождения дисперсии, также Вы можете посмотреть другие задачи на её нахождение
Пример 1. Определение групповой, средней из групповой, межгрупповой и общей дисперсии
Пример 2. Нахождение дисперсии и коэффициента вариации в группировочной таблице
Пример 3. Нахождение дисперсии в дискретном ряду
Пример 4. Имеются следующие данные по группе из 20 студентов заочного отделения. Нужно построить интервальный ряд распределения признака, рассчитать среднее значение признака и изучить его дисперсию
Построим интервальную группировку. Определим размах интервала по формуле:
где X max– максимальное значение группировочного признака;
X min–минимальное значение группировочного признака;
n – количество интервалов:
Принимаем n=5. Шаг равен: h = (192 - 159)/ 5 = 6,6
Составим интервальную группировку
Для дальнейших расчетов построим вспомогательную таблицу:
X"i– середина интервала. (например середина интервала 159 – 165,6 = 162,3)
Среднюю величину роста студентов определим по формуле средней арифметической взвешенной:
Определим дисперсию по формуле:
Формулу можно преобразовать так:
Из этой формулы следует, что дисперсия равна разности средней из квадратов вариантов и квадрата и средней.
Дисперсия в вариационных рядах с равными интервалами по способу моментов может быть рассчитана следующим способом при использовании второго свойства дисперсии (разделив все варианты на величину интервала). Определении дисперсии , вычисленной по способу моментов, по следующей формуле менее трудоемок:
где i - величина интервала;
А - условный ноль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой;
m1 - квадрат момента первого порядка;
m2 - момент второго порядка
Дисперсия альтернативного признака (если в статистической совокупности признак изменяется так, что имеются только два взаимно исключающих друг друга варианта, то такая изменчивость называется альтернативной) может быть вычислена по формуле:
Подставляя в данную формулу дисперсии q =1- р, получаем:
Виды дисперсии
Общая дисперсия измеряет вариацию признака по всей совокупности в целом под влиянием всех факторов, обуславливающих эту вариацию. Она равняется среднему квадрату отклонений отдельных значений признака х от общего среднего значения х и может быть определена как простая дисперсия или взвешенная дисперсия.
Внутригрупповая дисперсия характеризует случайную вариацию, т.е. часть вариации, которая обусловлена влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Такая дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы X от средней арифметической группы и может быть вычислена как простая дисперсия или как взвешенная дисперсия.
Таким образом, внутригрупповая дисперсия измеряет вариацию признака внутри группы и определяется по формуле:
где хi - групповая средняя;
ni - число единиц в группе.
Например, внутригрупповые дисперсии, которые надо определить в задаче изучения влияния квалификации рабочих на уровень производительности труда в цехе показывают вариации выработки в каждой группе, вызванные всеми возможными факторами (техническое состояние оборудования, обеспеченность инструментами и материалами, возраст рабочих, интенсивность труда и т.д.), кроме отличий в квалификационном разряде (внутри группы все рабочие имеют одну и ту же квалификацию).
.
Обратно, если - неотрицательная п.в. функция, такая что , то существует абсолютно непрерывная вероятностная мера на такая, что является её плотностью.
Замена меры в интеграле Лебега:
,
где любая борелевская функция, интегрируемая относительно вероятностной меры .
Дисперсия в статистике находится как среднее квадратическое отклонение индивидуальных значений признака в квадрате от средней арифметической. В зависимости от исходных данных она определяется по формулам простой и взвешенной дисперсий:
1. Простая дисперсия (для несгруппированных данных) вычисляется по формуле:
2. Взвешенная дисперсия (для вариационного ряда):
где n - частота (повторяемость фактора Х)
На данной странице описан стандартный пример нахождения дисперсии, также Вы можете посмотреть другие задачи на её нахождение
Пример 1. Определение групповой, средней из групповой, межгрупповой и общей дисперсии
Пример 2. Нахождение дисперсии и коэффициента вариации в группировочной таблице
Пример 3. Нахождение дисперсии в дискретном ряду
Пример 4. Имеются следующие данные по группе из 20 студентов заочного отделения. Нужно построить интервальный ряд распределения признака, рассчитать среднее значение признака и изучить его дисперсию
Построим интервальную группировку. Определим размах интервала по формуле:
где X max– максимальное значение группировочного признака; X min–минимальное значение группировочного признака; n – количество интервалов:
Принимаем n=5. Шаг равен: h = (192 - 159)/ 5 = 6,6
Составим интервальную группировку
Для дальнейших расчетов построим вспомогательную таблицу:
X"i– середина интервала. (например середина интервала 159 – 165,6 = 162,3)
Среднюю величину роста студентов определим по формуле средней арифметической взвешенной:
Определим дисперсию по формуле:
Формулу можно преобразовать так:
Из этой формулы следует, что дисперсия равна разности средней из квадратов вариантов и квадрата и средней.
Дисперсия в вариационных рядах с равными интервалами по способу моментов может быть рассчитана следующим способом при использовании второго свойства дисперсии (разделив все варианты на величину интервала). Определении дисперсии , вычисленной по способу моментов, по следующей формуле менее трудоемок:
где i - величина интервала; А - условный ноль, в качестве которого удобно использовать середину интервала, обладающего наибольшей частотой; m1 - квадрат момента первого порядка; m2 - момент второго порядка
Дисперсия альтернативного признака (если в статистической совокупности признак изменяется так, что имеются только два взаимно исключающих друг друга варианта, то такая изменчивость называется альтернативной) может быть вычислена по формуле:
Подставляя в данную формулу дисперсии q =1- р, получаем:
Общая дисперсия измеряет вариацию признака по всей совокупности в целом под влиянием всех факторов, обуславливающих эту вариацию. Она равняется среднему квадрату отклонений отдельных значений признака х от общего среднего значения х и может быть определена как простая дисперсия или взвешенная дисперсия.
Внутригрупповая дисперсия характеризует случайную вариацию, т.е. часть вариации, которая обусловлена влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Такая дисперсия равна среднему квадрату отклонений отдельных значений признака внутри группы X от средней арифметической группы и может быть вычислена как простая дисперсия или как взвешенная дисперсия.
Таким образом, внутригрупповая дисперсия измеряет вариацию признака внутри группы и определяется по формуле:
где хi - групповая средняя; ni - число единиц в группе.
Например, внутригрупповые дисперсии, которые надо определить в задаче изучения влияния квалификации рабочих на уровень производительности труда в цехе показывают вариации выработки в каждой группе, вызванные всеми возможными факторами (техническое состояние оборудования, обеспеченность инструментами и материалами, возраст рабочих, интенсивность труда и т.д.), кроме отличий в квалификационном разряде (внутри группы все рабочие имеют одну и ту же квалификацию).
Средняя из внутри групповых дисперсий отражает случайную вариацию, т. е. ту часть вариации, которая происходила под влиянием всех прочих факторов, за исключением фактора группировки. Она рассчитывается по формуле:
Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, которая обусловлена влиянием признака-фактора, положенного в основание группировки. Она равняется среднему квадрату отклонений групповых средних от общей средней. Межгрупповая дисперсия рассчитывается по формуле:
Математическим ожиданием (средним значением) случайной величины X , заданной на дискретном вероятностном пространстве, называется число m =M[X]=∑x i p i , если ряд сходится абсолютно.
Назначение сервиса . С помощью сервиса в онлайн режиме вычисляются математическое ожидание, дисперсия и среднеквадратическое отклонение (см. пример). Кроме этого строится график функции распределения F(X) .
Пример
. Известны математические ожидания и дисперсии двух независимых случайных величин X и Y: M(x)=8 , M(Y)=7 , D(X)=9 , D(Y)=6 . Найти математическое ожидание и дисперсию случайное величины Z=9X-8Y+7 .
Решение. Исходя из свойств математического ожидания: M(Z) = M(9X-8Y+7) = 9*M(X) - 8*M(Y) + M(7) = 9*8 - 8*7 + 7 = 23.
Исходя из свойств дисперсии: D(Z) = D(9X-8Y+7) = D(9X) - D(8Y) + D(7) = 9^2D(X) - 8^2D(Y) + 0 = 81*9 - 64*6 = 345
Пример №1 .
x i | 1 | 3 | 4 | 7 | 9 |
p i | 0.1 | 0.2 | 0.1 | 0.3 | 0.3 |
Пример №2 . Дискретная случайная величина имеет следующий ряд распределения:
Х | -10 | -5 | 0 | 5 | 10 |
р | а | 0,32 | 2a | 0,41 | 0,03 |
Решение. Величину a находим из соотношения: Σp i = 1
Σp i = a + 0,32 + 2 a + 0,41 + 0,03 = 0,76 + 3 a = 1
0.76 + 3 a = 1 или 0.24=3 a , откуда a = 0.08
Пример №3
. Определить закон распределения дискретной случайной величины, если известна её дисперсия, причем х 1
p 1 =0,3; p 2 =0,3; p 3 =0,1; p 4 =0,3
d(x)=12,96
Решение.
Здесь надо составить формулу нахождения дисперсии d(x) :
d(x) = x 1 2 p 1 +x 2 2 p 2 +x 3 2 p 3 +x 4 2 p 4 -m(x) 2
где матожидание m(x)=x 1 p 1 +x 2 p 2 +x 3 p 3 +x 4 p 4
Для наших данных
m(x)=6*0,3+9*0,3+x 3 *0,1+15*0,3=9+0.1x 3
12,96 = 6 2 0,3+9 2 0,3+x 3 2 0,1+15 2 0,3-(9+0.1x 3) 2
или -9/100 (x 2 -20x+96)=0
Соответственно надо найти корни уравнения, причем их будет два.
x 3 =8, x 3 =12
Выбираем тот, который удовлетворяет условию х 1
Закон распределения дискретной случайной величины
x 1 =6; x 2 =9; x 3 =12; x 4 =15
p 1 =0,3; p 2 =0,3; p 3 =0,1; p 4 =0,3
Часто в статистике при анализе какого-либо явления или процесса необходимо учитывать не только информацию о средних уровнях исследуемых показателей, но и разброс или вариацию значений отдельных единиц , которая является важной характеристикой изучаемой совокупности.
В наибольшей степени вариации подвержены курсы акций, объемы спроса и предложения, процентные ставки в разные периоды времени и в разных местах.
Основными показателями, характеризующими вариацию , являются размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.
Размах вариации представляет собой разность максимального и минимального значений признака: R = Xmax – Xmin . Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.
Дисперсия лишена этого недостатка. Она рассчитывается как средний квадрат отклонений значений признака от их средней величины:
Упрощенный способ расчета дисперсии осуществляется с помощью следующих формул (простой и взвешенной):
Примеры применения данных формул представлены в задачах 1 и 2.
Широко распространенным на практике показателем является среднее квадратическое отклонение :
Среднее квадратическое отклонение определяется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак.
Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемого признака. В отличие от них, коэффициент вариации измеряет колеблемость в относительном выражении - относительно среднего уровня, что во многих случаях является предпочтительнее.
Формула для расчета коэффициента вариации.
Задача 1 . При изучении влияния рекламы на размер среднемесячного вклада в банках района обследовано 2 банка. Получены следующие результаты:
Определить:
1) для каждого банка: а) средний размер вклада за месяц; б) дисперсию вклада;
2) средний размер вклада за месяц для двух банков вместе;
3) Дисперсию вклада для 2-х банков, зависящую от рекламы;
4) Дисперсию вклада для 2-х банков, зависящую от всех факторов, кроме рекламы;
5) Общую дисперсию используя правило сложения;
6) Коэффициент детерминации;
7) Корреляционное отношение.
Решение
1) Составим расчетную таблицу для банка с рекламой . Для определения среднего размера вклада за месяц найдем середины интервалов. При этом величина открытого интервала (первого) условно приравнивается к величине интервала, примыкающего к нему (второго).
Средний размер вклада найдем по формуле средней арифметической взвешенной:
29 000/50 = 580 руб.
Дисперсию вклада найдем по формуле:
23 400/50 = 468
Аналогичные действия произведем для банка без рекламы :
2) Найдем средний размер вклада для двух банков вместе. Хср =(580×50+542,8×50)/100 = 561,4 руб.
3) Дисперсию вклада, для двух банков, зависящую от рекламы найдем по формуле: σ 2 =pq (формула дисперсии альтернативного признака). Здесь р=0,5 – доля факторов, зависящих от рекламы; q=1-0,5, тогда σ 2 =0,5*0,5=0,25.
4) Поскольку доля остальных факторов равна 0,5, то дисперсия вклада для двух банков, зависящая от всех факторов кроме рекламы тоже 0,25.
5) Определим общую дисперсию, используя правило сложения.
= (468*50+636,16*50)/100=552,08
= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96
σ 2 = σ 2 факт + σ 2 ост = 552,08+345,96 = 898,04
6) Коэффициент детерминации η 2 = σ 2 факт / σ 2 = 345,96/898,04 = 0,39 = 39% - размер вклада на 39% зависит от рекламы.
7) Эмпирическое корреляционное отношение η = √η 2 = √0,39 = 0,62 – связь достаточно тесная.
Задача 2 . Имеется группировка предприятий по величине товарной продукции:
Определить: 1) дисперсию величины товарной продукции; 2) среднее квадратическое отклонение; 3) коэффициент вариации.
Решение
1) По условию представлен интервальный ряд распределения. Его необходимо выразить дискретно, то есть найти середину интервала (х"). В группах закрытых интервалов середину найдем по простой средней арифметической. В группах с верхней границей - как разность между этой верхней границей и половиной размера следующего за ним интервала (200-(400-200):2=100).
В группах с нижней границей – суммой этой нижней границы и половины размера предыдущего интервала (800+(800-600):2=900).
Расчет средней величины товарной продукции делаем по формуле:
Хср = k×((Σ((х"-a):k)×f):Σf)+a. Здесь а=500 - размер варианта при наибольшей частоте, k=600-400=200 - размер интервала при наибольшей частоте. Результат поместим в таблицу:
Итак, средняя величина товарной продукции за изучаемый период в целом равна Хср = (-5:37)×200+500=472,97 тыс. руб.
2) Дисперсию найдем по следующей формуле:
σ 2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05
3) среднее квадратическое отклонение: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 тыс. руб.
4) коэффициент вариации: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%
Во многих случаях возникает необходимость ввести ещё одну числовую характеристику для измерения степени рассеивания, разброса значений , принимаемых случайной величиной ξ , вокруг её математического ожидания.
Определение. Дисперсией случайной величины ξ называется число.
D ξ = M(ξ-M ξ) 2 . (1)
Другими словами, дисперсия есть математическое ожидание квадрата отклонения значений случайной величины от её среднего значения.
называется средним квадратичным отклонением
величины ξ .
Если дисперсия характеризует средний размер квадрата отклонения ξ oт Mξ , то число можно рассматривать как некоторую среднюю характеристику самого отклонения, точнее, величины | ξ-Mξ |.
Из определения (1) вытекают следующие два свойства дисперсии.
1. Дисперсия постоянной величины равна нулю. Это вполне соответствует наглядному смыслу дисперсии, как «меры разброса».
Действительно, если
ξ = С, то Mξ = C и, значит Dξ = M(C-C ) 2 = M 0 = 0.
2. При умножении случайной величины ξ на постоянное число С её дисперсия умножается на C 2
D(Cξ ) = C 2 Dξ . (3)
Действительно
D(Cξ) = M(C
= M(C .
3. Имеет место, следующая формула для вычисления дисперсии:
. (4)
Доказательство этой формулы следует из свойств математического ожидания.
Мы имеем:
4. Если величины ξ 1 и ξ 2 независимы, то дисперсия их суммы равна сумме их дисперсий:
Доказательство . Для доказательства используем свойства математического ожидания. Пусть Mξ 1 = m 1 , Mξ 2 = m 2 , тогда.
Формула (5) доказана.
Так как дисперсия случайной величины есть по определению математическое ожидание величины (ξ -m ) 2 , где m = Mξ , то для вычисления дисперсии можно воспользоваться формулами, полученными в §7 гл.II.
Так, если ξ есть ДСВ с законом распределения
x 1 | x 2 | ... |
p 1 | p 2 | ... |
то будем иметь:
. (7)
Если ξ непрерывна случайная величина с плотностью распределения p(x) , тогда получим:
Dξ = . (8)
Если использовать формулу (4) для вычисления дисперсии, то можно получить другие формулы, а именно:
, (9)
если величина ξ дискретна, и
Dξ = , (10)
если ξ распределена с плотностью p (x ).
Пример 1 . Пусть величина ξ равномерно распределена на отрезке [a,b ]. Воспользовавшись формулой (10) получим:
Можно показать, что дисперсия случайной величины , распределенной по нормальному закону с плотностью
p(x) = , (11)
равна σ 2 .
Тем самым выясняется смысл параметра σ, входящего в выражение плотности (11) для нормального закона; σ ecть среднее квадратичное отклонение величины ξ .
Пример 2 . Найти дисперсию случайной величины ξ , распределенной по биномиальному закону.
Решение . Воспользовавшись представлением ξ в виде
ξ = ξ 1 + ξ 2 + ξ n (см. пример 2 §7 гл. II) и применяя формулу сложения дисперсий для независимых величин, получим
Dξ = Dξ 1 + Dξ 2 + Dξ n .
Дисперсия любой из величин ξ i (i = 1,2, n ) подсчитывается непосредственно:
Dξ i = M(ξ i ) 2 - (Mξ i ) 2 = 0 2 · q + 1 2 p - p 2 = p (1-p ) = pq .
Окончательно получаем
Dξ = npq , где q = 1 - p .