Мои Конспекты
Главная | Обратная связь


Автомобили
Астрономия
Биология
География
Дом и сад
Другие языки
Другое
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Металлургия
Механика
Образование
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Туризм
Физика
Философия
Финансы
Химия
Черчение
Экология
Экономика
Электроника

Справочные материалы



Пример 5.1. Рассмотрим два вариационных ряда:

Ряд I: 1, 2, 3, 4, 5, 6, 6, 7, 8, 9, 10, 11.

Ряд II: 4, 5, 5, 5, 6, 6, 6, 6, 7, 7, 7, 8.

В чем отличие между рядами, если

 

Рис.6.1. Сравнение вариации рядов I и II

Рисунок 6.1. графически изображает ряд I и ряд II. Ряд I более вариабелен, чем ряд II.

В статистике используется ряд мер вариабельности (колеблемости).

Интерквартильный размах определяют как разницу между третьим и первым квартилями.

(5.1)

Другая подобная мера – размах вариации –разность между наибольшим и наименьшим значениями признака ряда.

(6.2)

По данным примера 5.1 имеем IQRI = 5,5; IQRII = 2; RI = 10; RII = 4.

 

Существуют и другие более часто используемые меры вариации. Это: среднее линейное отклонение, дисперсия и стандартное отклонение (или среднее квадратическое отклонение), определяющие вариацию как меру отклонений значений признаков вариационного ряда от центра ряда распределения – средней арифметической.

Среднее линейное отклонение есть средняя арифметическая абсолютных значений отклонений значений признаков ряда от их средней арифметической.

- простое:

(5.3)

- взвешенное:

(5.4)

 

Дисперсия вариационного ряда есть средняя арифметическая квадрата отклонения (средний квадрат отклонения) значений признаков ряда от их средней арифметической.

- простая:

(5.5)

- взвешенная:

(5.6)

 

Стандартное (среднее квадратическое) отклонение вариационного ряда есть арифметическое значение корня квадратного из дисперсии.

 

5.7)

- простое:

(5.7а)

- взвешенное:

(5.7б)

 

Для ручного счета лучше пользоваться формулой дисперсии следующего вида.

(5.8)

 

Для оценки интенсивности вариации и сравнения ее в разных совокупностях и различных признаков применяются относительные показатели вариации, которые вычисляются как отношение абсолютных показателей силы вариации к средней арифметической. Существуют следующие показатели, выраженные в процентах: относительный размах вариации, относительное линейное отклонение и коэффициент вариации.

Относительный размах вариации (коэффициент осцилляции) отражает относительную меру колеблемости крайних значений признака вокруг средней.

(5.9)

 

Относительное линейное отклонение отражает долю усредненного значения абсолютных отклонений от средней величины.

 

(5.10)

 

Коэффициент вариации позволяет представить дисперсию как долю от средней величины.

(5.11)

 

Чем меньше значение коэффициента вариации, тем однороднее совокупность по изучаемому признаку и типичнее средняя.[4]

Для более ясного представления и использования в экономико-статистическом анализе показатели вариации представлены на схеме 6.1.

При изучении вариации для сгруппированных данных выделяют три вида дисперсий: общую дисперсию, внутригрупповую (частную) дисперсию, межгрупповую дисперсию.

Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов.

(5.12)

 

Схема 5.1. Статистическое изучение вариации

 

Внутригрупповая (частная) дисперсия измеряет вариацию признака внутри группы.

 

(5.13)

где xi – значения признаков внутри j-й группы;

– средняя арифметическая j-й группы;

fi – частоты вариантов в j-й группе;

– объем j-й группы. Суммирование и в числителе, и в знаменателе осуществляется только по тем признакам, которые попали в j-ю группу.

Средняя из внутригрупповых (частных) дисперсий.

 

(5.14)

где Nj – объем j-й группы, j=1,2,…,l (l – число групп),

- общее число признаков ряда.

Межгрупповая дисперсия измеряет колеблемость групповых средних вокруг общей средней и отражает вариацию, обусловленную признаком, положенным в основу группировки.

 

(5.15)

 

где - общая средняя вариационного ряда.

 

Существует закон (правило сложения дисперсий), связывающий три вида дисперсии.

Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий.

 

(5.16)

 

Зная любые два вида дисперсий, всегда можно найти или проверить правильность расчета третьего вида.

 

(5.16а)

(5.16б)

Правило сложения дисперсий позволяет оценить степень влияния группировочного признака на результативный признак и количественно измерить степень этого влияния.

Для этого применяется коэффициент детерминации, который показывает степень колеблемости в процентах результативного признака в зависимости от степени колеблемости факторного и рассчитывается как отношение факторной дисперсии к общей дисперсии результативного признака.

(5.17)

 

Корень квадратный из коэффициента детерминации называют эмпирическим корреляционным отношением (ЭКО), которое показывает степень тесноты связи.

(5.18)

 

Это показатель принимает значения в интервале [0,1]. Если связь отсутствует, то h=0. В этом случае дисперсия групповых средних равна нулю ( ), то есть все групповые средние равны между собой и межгрупповой вариации нет. Если связь функциональная, то h=1. В этом случае дисперсия групповых средних равна общей дисперсии ( ). Промежуточные значения h оцениваются по степени их близости к предельным.

 

Пример 5.2. Опрос 8 биржевых брокеров дал следующие результаты:

Брокер Проходил ли переобучение в последние три года Число контрактов, заключенных в день опроса
Да
Нет
Нет
Да
Нет
Да
Да
Нет

Среднее число контрактов, заключенных брокерами:

.

В данном примере переподготовка – факторный признак, а число заключаемых контрактов – результативный. Сгруппируем эти данные по признаку переобучения и рассчитаем средние по каждой группе.

 

Группы брокеров Число брокеров Число контрактов Групповые средние
Прошли переобучение 9, 8, 8, 7
Не прошли переобучение 8, 7, 7, 6

 

, где n1 – число признаков в первой группе.

Или по формуле для взвешенных вариант

, где fi – частоты ряда.

, где n2 – число признаков во второй группе.

Или по формуле для взвешенных вариант

, где fi – частоты ряда.

 

Рассчитаем дисперсии в каждой группе.

Дисперсия числа заключенных контрактов у брокеров, прошедших переобучение:

Число контрактов Х Частота f
-1
Итого - -

 

Дисперсия числа заключенных контрактов у брокеров, не прошедших переобучение:

Число контрактов Х Частота f
-1
Итого - -

Рассчитаем среднюю из внутригрупповых дисперсий:

Этот показатель характеризует влияние на результативный признак всех прочих факторных признаков за исключением признака, положенного в основу группировки. Очевидно, что различие в числе заключенных контрактов в двух группах вызвано тем, что брокеры первой группы прошли переобучение, а брокеры второй группы не прошли.

Найдем дисперсию между группами (межгрупповую дисперсию).

Этот показатель характеризует влияние на результативный признак факторного признака, положенного в основу группировки.

Рассчитаем общую дисперсию числа заключенных контрактов.

 

Число контрактов Х Частота f
1,5 0,5 -0,5 -1,5 2,25 0,25 0,25 2,25 2,25 0,75 0,75 2,25
Итого - - 6,0

Итак, по данным примера имеем , , .

Тогда по правилу сложения дисперсий получаем 0,75 = 0,5 + 0,25.

Рассчитаем коэффициент детерминации: или 33%.

То есть вариация числа заключенных контрактов на 33% объясняется фактором переобучения, 67% - это влияние прочих факторов.

Эмпирическое корреляционное отношение: .

Следовательно, фактор, положенный в основу группировки, существенно влияет на число заключаемых брокерами контрактов, но существуют и другие факторы, влияние которых тоже значительно.

 

При статистическом выражении колеблемости альтернативных признаковналичие изучаемого признака обозначается 1, а его отсутствие – 0. Доля вариантов, обладающих изучаемым признаком обозначается р, а доля вариантов, не обладающих признаком – q. Следовательно, р + q = 1.

Найдем их среднее значение и дисперсию:

 

(5.19)

 

(5.20)

 

Дисперсия альтернативного признака равна произведению доли единиц, обладающих признаком, и доли единиц, не обладающих им.

 

Пример 5.3. На 10000 населения приходится 4000 мужчин и 6000 женщин. Определить среднее квадратическое отклонение по полу.

Решение: Доля мужчин в населении p = 4000/10000 = 0,4; доля женщин q = 6000/10000 = 0,6. Тогда дисперсия , а среднее квадратическое отклонение .

 

Пример 5.4. Налоговой инспекцией одного из районов города проведено 86 проверок коммерческих фирм и в 37 обнаружены финансовые нарушения. Определить среднее квадратическое отклонение числа нарушений.

Решение: По условию n=86, m=37, тогда доля фирм, в которых обнаружены нарушения, составит p=37/86=0,43; q=1-0,43=0,57. Дисперсия - , а среднее квадратическое отклонение .

 

Правило сложения дисперсий распространяется и на дисперсии доли признака, то есть доли единиц с определенным признаком в совокупности, разбитой на части (группы).

Внутригрупповая дисперсия доли определяется по формуле:

 

(5.21)

 

Средняя из внутригрупповых дисперсий рассчитывается так:

 

(5.22)

где ni – численность единиц в отдельных группах;

 

Формула межгрупповой дисперсии имеет следующий вид:

 

(5.23)

где – доля изучаемого признака во всей совокупности, которая определяется по формуле:

(5.24)

Общая дисперсия определяется по формуле:

 

(5.25)

Три вида дисперсий объединены между собой следующим образом:

(5.26)

 

Это – правило сложения дисперсии доли признака.

 

Пример 5.5. Имеются следующие данные об удельном весе основных рабочих в трех цехах фирмы:

Цех Удельный вес основных рабочих в % (pi) Численность всех рабочих в %
Итого -

Определить общую дисперсию доли основных рабочих по всей фирме, используя правило сложения дисперсий.

Решение:

1) Определим долю рабочих в целом по фирме (формула 5.24.).

.

2) Общая дисперсия доли основных рабочих по фирме в целом будет равна (формула 5.25):

.

3) Внутрицеховые дисперсии рассчитаем, применив формулу 5.21.

4)Средняя из внутригрупповых дисперсий будет равна (формула 5.22.)

.

5) Межгрупповую дисперсию определим по формуле 5.23.

.

Проверка вычислений показывает: 0,154 = 0,15 + 0,004.

 

Анализ вариации в рядах распределения целесообразно дополнить показателями дифференциации и концентрации.

Для оценки дифференциации значений признака ряда используются децильный коэффициент дифференциации и коэффициент фондов.

Децильный коэффициент равен отношению девятой децили к первой децили. Децильный коэффициент широко применяют при измерении соотношения уровней дохода 10% наиболее обеспеченного и 10% наименее обеспеченного населения (в разах).

Коэффициент фондов равен отношению среднего уровня 10-й децили к среднему уровню 1-й децили. Он дает более точный уровень дифференциации.

Государственная статистика регулярно публикует коэффициент фондов для характеристики дифференциации доходов. Однако в исследовательской работе чаще используется децильный коэффициент дифференциации. Его применение особенно эффективно в случае, если, например, в распределении доходов в начале первого дециля присутствуют крайне низкие доходы, а десятый дециль завершается аномально высокими доходами, которые существенно влияют на сумму доходов в этих децилях. В такой ситуации правильнее применять децильный коэффициент дифференциации, а не коэффициент фондов.

К показателям дифференциации близки по значению показатели концентрации: коэффициент Джини и коэффициент Герфиндаля.

Коэффициент концентрации Джини рассчитывается по формуле:

, (5.27)

где pi – накопленная доля (частость) численности единиц ряда

qi – накопленная доля значений признака, приходящаяся на все единицы ряда со значеними признака не более xi.[5].

 

Коэффициент Джини может принимать значения от 0 до 1, поэтому результат следует разделить либо на 100, если pi или qi выражен в процентах, либо на 10000, если оба показателя выражены в процентах. Чем больше концентрация признака, тем ближе коэффициент Джини к 1. Коэффициент Джини используют для характеристики степени неравномерности распределения совокупности (например, населения) по уровню признака (например, доходов).

 

Коэффициент Герфиндаля вычисляется на основе данных о доле изучаемого признака в i-той группе в совокупном объеме признака:

или (5.28)

где - доля объёма значений признака в i-той группе в общем объеме всех значений признака;

- объём значений признака в i-той группе.

Показатель Н зависит от числа единиц в группах.

Пример 5.6.Имеются данные о полученной балансовой прибыли 50 крупнейших банков России (по состоянию на 01.01.1998 г.), (в млн. руб.)

№ банка Балансовая прибыль, млн. руб. № банка Балансовая прибыль, млн. руб. № банка Балансовая прибыль, млн. руб. № банка Балансовая прибыль, млн. руб. № банка Балансовая прибыль, млн. руб.
974,2 188,8 143,9 85,4 69,3
609,2 187,3 134,6 84,5 66,4
588,3 186,8 120,9 82,4 66,2
562,9 171,1 112,2 79,6 59,7
436,3 167,9 108,5 74,3 59,1
432,5 164,3 101,6 74,0 58,3
283,6 160,3 101,3 73,5 57,4
265,8 159,9 97,4 73,2 53,8
231,5 157,5 97,4 73,0 51,4
211,7 147,6 92,0 71,5 51,2

 

Величина балансовой прибыли Сбербанка России на 01.07.97 - 4353,283 млн. руб.

1. Постройте вариационный ряд, образовав 7-8 интервалов произвольно.

2. Рассчитайте средний размер балансовой прибыли на один банк на основе средней арифметической, моды и медианы.

3. Рассчитайте показатели вариации.

4. Измерьте дифференциацию банков на основе децильного коэффициента и коэффициента фондов.

5. Рассчитайте коэффициент концентрации Джини и Герфиндаля.

Решение:

1. Распределение 50 банков РФ по размеру балансовой прибыли (БП) на 01.01.1998 г.

 

БП, млн. руб. xk-1 – xk Количество банков Сере-дина интервала xi xifi Накопл. частоты Vi, % На-копл. частости pi Доля БП групп банков в общем объеме БП
fi в % к итогу нарастающим итогом, qi
А
50-60 0,042 0,042 0,02
60-80 0,076 0,118 0,006
80-100 0,059 0,177 0,003
100-150 0,109 0,286 0,012
150-300 0,318 0,604 0,101
300-500 0,087 0,691 0,008
500-800 0,212 0,902 0,045
800-1000 0,098 1,0 0,010
Итого - - - - 0,187

2. Средние показатели:

а) средний размер балансовой прибыли на один банк рассчитаем по средней арифметической взвешенной

б) моду рассчитаем по формуле (4.13)

 

 

Модальный интервал – 150-300, т.к. частота этого интервала, равная 13, является максимальной.

 

 

в) медиану рассчитаем по формуле (4.12)

 

 

Медианный интервал – 100-150, т.к. накопленная частота этого интервала, равная 31, - первая накопленная частота, превышающая половину суммы частот ряда.

 

 

3. Показатели вариации:

а) дисперсия (по формуле 5.6).

 

=

 

б) среднее квадратическое отклонение (по формуле 5.7)

 

 

в) коэффициент вариации (по формуле 5.11)

 

 

V>35%, что свидетельствует о неоднородности совокупности.

 

4. Показатели дифференциации:

а) для нахождения децильного коэффициента определим вначале первый и девятый децили по формуле 5.4.

 

 

Интервал, соответствующий первому децилю – 50-60, т.к. накопленная частота этого интервала, равная 7, первая накопленная частота, превышающая 0,1 суммы частот.

 

 

Интервал, соответствующий девятому децилю – 300-500, т.к. накопленная частота этого интервала, равная 14, первая накопленная частота, превышающая 0,9 суммы частот.

Тогда децильный коэффициент составит:

б) т.к. 10% самых крупных и 10% самых мелких банков составляют одну и ту же величину (в нашем примере ), то коэффициент фондов составит (по данным исходной таблицы):

 

5. Показатели концентрации:

а) коэффициент Джини рассчитаем по формуле 5.27, произведя предварительные расчеты

 

1,652 1,428
6,018 5,428
13,156 10,974
37,448 25,168
60,808 55,568
82,984 67,718
90,02

 

б) коэффициент Герфиндаля определим по формуле 5.28 (см. итог гр. 9):

 

Пример 5.7.Для иллюстрации принципа расчета коэффициентов Джини и Герфиндаля воспользуемся данными выборочного обследования дневной выручки 20 продуктовых магазинов (тыс. руб):

 

Номера магазинов i Значения признака (выручка магазина) хi Накопленные значения признака   Накопленная доля значений признака qi Накопленная доля численности единиц ряда: pi
0,022 0,05 0,002 - 0,0005
0,044 0,1 0,007 0,002 0,0005
0,071 0,15 0,014 0,007 0,0007
0,1 0,2 0,025 0,015 0,0009
0,137 0,25 0,041 0,027 0,0013
0,176 0,3 0,062 0,044 0,0015
0,218 0,35 0,087 0,065 0,0017
0,262 0,4 0,118 0,092 0,0019
0,308 0,45 0,154 0,123 0,0021
0,359 0,5 0,198 0,162 0,0026
0,411 0,55 0,246 0,205 0,0026
0,472 0,6 0,307 0,296 0,0037
0,533 0,65 0,373 0,320 0,0037
0,597 0,7 0,447 0,388 0,0040
0,66 0,75 0,528 0,462 0,0040
0,724 0,8 0,615 0,543 0,0040
0,787 0,85 0,709 0,630 0,0040
0,853 0,9 0,811 0,725 0,0044
0,927 0,95 0,927 0,834 0,0054
1,0 1,0 - 0,95 0,0054
å         5,670 5,584 0,05528

 

Коэффициент Джини равен 0,086, что свидетельствует о невысоком уровне концентрации выручки магазинов. Значение коэффициента Герфиндаля, равное 0,05528, подтверждает этот вывод.

Следует отметить, что приведенные расчеты носят исключительно иллюстративный характер, поскольку экономический смысл коэффициентов Джини и Герфиндаля наиболее полно проявляется лишь при проведении сравнений исследуемых явлений во времени и в пространстве. Например, коэффициента Джини для характеристики дифференциации доходов населения в различных регионах РФ или странах, коэффициента Герфиндаля для характеристики концентрации производства, капитала. Основное достоинство коэффициента Герфиндаля – его высокая чувствительность к изменению в суммарном обороте долей крупнейших участников, что позволяет отслеживать концентрацию рыночного оборота и реагирует на число участников рынка. Коэффициент Герфиндаля может быть использован в качестве меры диверсификации кредитного портфеля банка. Чем меньше значение коэффициента Герфиндаля, т.е. чем больше диверсифицирован кредитный портфель, тем ниже могут быть требования по капиталу к кредитному портфелю.

 

 


Контрольные задания к теме 5

1. Дисперсия признака равна 600. Объем совокупности равен 10. Сумма квадратов индивидуальных значений признака равна 6250. Найти среднюю величину.

 

2. Определить дисперсию признака, если средняя величина признака равна 2600, а коэффициент вариации признака равен 30%.

 

3.Для изучения уровня заработной платы рабочих на предприятии обследовано 500 мужчин и 300 женщин. Результаты исследования показали, что у мужчин средняя заработная плата составила 1200 у.е. при среднеквадратическом отклонении 200 у.е., у женщин соответственно 800 у.е. и 150 у.е.

Определить:

1) среднюю заработную плату работников предпритятия;

2) дисперсии заработной платы и коэффициент вариации;

3) коэффициент детерминации и эмпирическое корреляционное отношение.

 

4. Имеются следующие данные (условные) по трем группам рабочих:

 

Стаж работы (лет) Число рабочих Средняя заработная плата, руб. Среднеквадратическое отклонение заработной платы
до 3
3 –10
более 10

 

Рассчитать:

1) среднюю заработную плату всей совокупности рабочих;

2) дисперсии заработной платы;

3) коэффициент детерминации и эмпирическое корреляционное отношение.

 

5. При изучении бюджета времени студентов было проведено обследование учащихся ВУЗов. При обследовании ВУЗы были разбиты на 7 групп по специализации. Были получены следующие результаты среднего количества времени, затрачиваемого студентами ежедневно на самостоятельную работу:

 

ВУЗы по группам специальностей Число обследованных студентов, тыс.чел. Среднее число часов на самостоятельную работу Средний квадрат отклонений
Промышленность и строительство     2,0   0,6
Транспорт 1,4 0,5
Право 1,7 0,3
Экономика 1,5 0,7
Здравоохранение 1,0 0,8
Искусство 1,6 1,0
Просвещение 1,8 0,.6

 

Используя правило сложения дисперсий определить зависимость между средним числом часов на самостоятельную работу от специализации студента.

 

6. По переписи населения 1926 года в России доля грамотных среди женщин составляла 46%, а среди мужчин – 77%. Определить общий (средний) процент грамотности всего населения и дисперсию этого показателя, если женщины составляли 53% в общей численности населения.

 

7. Определить дисперсию и среднее квадратическое отклонение, если при проверке партии изделий из 1000 шт. 30 шт. оказались бракованными.

 

8. Имеются данные о совокупной выручке (млрд. руб.) за год 50-ти крупнейших аудиторско-консультационных фирм

№ фирмы Выручка, млрд. руб. № фирмы Выручка, млрд. руб. № фирмы Выручка, млрд. руб. № фирмы Выручка, млрд. руб. № фирмы Выручка, млрд. руб.
78,1 17,5 7,2 4,0 2,7
44,8 15,8 7,0 3,8 2,7
35,2 15,7 6,8 3,6 2,7
34,6 14,5 6,6 3,6 2,7
32,5 13,2 5,6 3,5 2,6
31,8 12,0 5,1 3,1 2,6
25,4 11,6 4,8 3,0 2,2
23,0 9,4 4,5 3,0 2,1
17,8 7,6 4,5 3,0 1,5
17,7 7,3 4,4 2,9 1,5

1) Постройте вариационный ряд, образовав 7-8 интервалов произвольно.

2) Рассчитайте средний размер размер выручки на одну фирму на основе средней арифметической, моды медианы.

3) Рассчитайте показатели вариации.

4) Измерьте дифференциацию выручки на основе децильного коэффициента и коэффициента фондов.

5) Рассчитайте коэффициент концентрации Джини и Герфиндаля.

 

9. Имеются данные о распределении населения РФ по размеру среднедушевого денежного дохода в первом полугодии 2000 года:

 

Среднедушевой денежный доход, ден. ед. Численность населения в % от общей численности
до 400 2,7
400,1-600,0 6,6
600,1-800,0 9,3
800,1-1000,0 10,1
1000,1-1200,0 9,9
1200,1-1600,0 16,9
1600,1-2000,0 12,6
свыше 2000,0 31,9
ВСЕГО: 100,0

 

Рассчитайте:

1) среднедушевой денежный доход на основе средней арифметической, моды и медианы;

2) показатели дифференциации концентрации.

 

10. Товарооборот по предприятиям общественного питания на одного работника за квартал характеризуется следующими данными:

 

Предприятие Доля предприятий в общей численности работников, % Товарооборот в расчете на одного работника, тыс. руб. Дисперсия товарооборота в группе
Столовые 3,29
Кафе, закусочные 36,00
Рестораны 9,00

 

Определите все виды дисперсий товарооборота предприятий общественного питания, коэффициент детерминации и эмпирическое корреляционное отношение.

 

 




Поиск по сайту:







©2015-2020 mykonspekts.ru Все права принадлежат авторам размещенных материалов.