Мои Конспекты
Главная | Обратная связь


Автомобили
Астрономия
Биология
География
Дом и сад
Другие языки
Другое
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Металлургия
Механика
Образование
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Туризм
Физика
Философия
Финансы
Химия
Черчение
Экология
Экономика
Электроника

Справочные материалы



Виды и формы связей, различаемые в статистике. При исследовании социально-экономических явлений часто приходится иметь дело с взаимосвязанными показателями.

Типы взаимосвязей по характеру зависимости, различаемые в статистике, представлены на схеме 8.1.

 

Схема 8.1.Типы взаимосвязей по характеру зависимости

Взаимосвязи можно классифицировать также следующим образом (схема 8.2):

 

Схема 8.2. Классификация связей

Для анализа статистических зависимостей на начальной стадии применяются методы, представленные на схеме 8.3.

Схема 8.3. Начальная стадия анализа статистических зависимостей

 

Пример 8. 1. Имеются данные о выпуске продукции на 6 однотипных предприятиях (х) и потреблении на них электричества (у) (таблица 8.1.):

Таблица 8.1.

Зависимость потребления электричества от объема выпуска продукции

Выпуск продукции
Потребление электричества

Сделать вывод о наличии, характере и форме связи.

Решение: Поле корреляции построено на рис. 8.1.

Рисунок 8.1. Зависимость потребления электричества от выпуска продукции

Таблица и рисунок демонстрируют, что с увеличением факторного признака х увеличивается результативный признак у, следовательно связь между ними можно считать прямой.

 

Пример 8. 2. Метод аналитических группировок продемонстрируем на примере таблицы 8.2.:

Таблица 8.2.

Характеристика зависимости прибыли малых предприятий от оборачиваемости оборотных средств за 2003 год

Продолжительность оборота средств, дней (х) Число малых предприятий Средняя прибыль, у.е. (y)
40 – 50 14,57
51 – 70 12,95
71 – 100 7,40
Итого 11,77

 

Графический метод демонстрируется на рисунке 8.2. Построив график, можно судить о форме связи, ее направлении, а по разбросу точек – о тесноте связи (отсутствие связи будет характеризоваться разбросанностью точек по всему графику).

а) прямая линейная зависимость   б) обратная линейная зависимость   в) зависимость отсутствует

Рис. 8.2. Графики поля корреляции

Измерение тесноты связи в случае корреляционной зависимости. Оценка тесноты связи между признаками предполагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (при изучении множественных зависимостей) факторных признаков.

Простейший показатель тесноты связи - показатель Фехнера.

, (8.1)

где C – совпадения знаков отклонений и ;

Н – несовпадения знаков отклонений и ;

– общее количество парных отклонений.

Мера совместной вариации признаков - коэффициент ковариации.

(8.2)

Показатель интенсивности линейной связи – линейный коэффициент парной корреляции Пирсона (коэффициент корреляции).

(8.3)

Путем ряда преобразований можно получить следующие аналитические выражения для расчета линейного коэффициента корреляции.

 

, (8.4)

где

 

(8.5)

 

(8.6)

 

(8.7)

 

Показатель Фехнера и коэффициент корреляции Пирсона изменяются в пределах [-1;+1].

 

Пример 8.3. Измерим тесноту связи с использованием формул (8.1) - (8.3) по данным примера 8.1.

Решение: 1) Расчет показателя Фехнера

Рассчитаем средние значения для х и у:

 

.

Выпуск продукции
Потребление электричества
-6 -5 -1
-9,83 -4,83 -0,83 -2,83 3,17 15,17
Совпадения/несовпадения С С С Н С С

 

Показатель Фехнера

2) Расчет коэффициента ковариации

 

3) Расчет линейного коэффициента корреляции:

С учетом того, что ,

Полученные значения показателя Фехнера и коэффициента корреляции свидетельствуют о достаточно сильной прямой связи.

 

На прямую или обратную связь указывает знак коэффициента («+» или «–» соответственно). О тесноте связи свидетельствует абсолютная величина коэффициента. Для качественной оценки тесноты связи используется таблица Чэддока (табл. 8.3.)

Таблица 8.3.

Критерии оценки тесноты связи (шкала Чеддока)

 

Значения коэффициента корреляции до        
Характеристика тесноты связи слабая умеренная заметная высокая достаточно высокая

 

Оценка достоверности коэффициента корреляции. Для более наглядного представления об оценке достоверности (значимости) коэффициента корреляции построена таблица 8.4.

 

Таблица 8.4.

Оценка достоверности (значимости) коэффициента корреляции

Характеристики коэффициента корреляции Средняя квадратическая ошибка Вывод о значимости коэффициента корреляции делается, если:
Большое число наблюдений, распределение приближенно нормальное, r < 0,9
Малое число наблюдений (n < 30), распределение далеко от нормального, r < 0,9 , где находится по таблице распределения Стьюдента с параметрами
Малое число наблюдений (n < 30), распределение далеко от нормального, r > 0,9 , где z – преобразование Фишера

 

Доверительные границы коэффициента корреляции рассчитываются как:

, (8.8)

где ρ – генеральное значение коэффициента корреляции;

tp – заданный уровень вероятности.

 

Пример 8.4. Проверить значимость коэффициента корреляции, рассчитанного по данным примера 8.1.

Решение: , , тогда , что указывает на значимость коэффициента корреляции.

 

Ранговая корреляция. В анализе социально-экономических явлений широко используются ранговые коэффициенты корреляции (коэффициенты корреляции рангов), когда коррелируют не непосредственные значения X и Y, а их ранги, т.е. номера их мест, занимаемых в каждом ряду значений по возрастанию или убыванию. К таким непараметрическим коэффициентам относятся коэффициенты рангов Спирмена и Кендэлла.

Коэффициент ранговой корреляции Спирмена:

 

(8.9)

 

Значимость коэффициента ранговой корреляции Спирмена:

 

(8.10)

 

Коэффициент корреляции Спирмена считается статистически значимым, если , где находится по таблице распределения Стьюдента с параметрами .

 

Пример 8.5.Имеются данные о затратах на рекламу продукции и объеме выручки от реализации продукции (табл. 8.5.; графы А и Б).

Таблица 8.5.

Зависимость затрат на рекламу продукции и объема выручки от реализации продукции

Затраты на рекламу продукции, тыс. руб., Х Объем выручки от реализации продукции, млн. руб., У
А Б
1,5
2,4
8,6
1,3 -3
3,3 -1
4,0
5,1
6,1
3,5 -4
7,1 -1
Итого - - - -

Вычислить коэффициент Спирмена.

Решение: Определив ранги значений X и Y и их разность (табл. 8.5.; графы 1, 2, 3, 4), получаем .

При условии, что ранги не повторяются, коэффициент ранговой корреляции Кендэлла рассчитывается как:

, (8.11)

где S – фактическая сумма рангов

При этом соблюдаем следующую последовательность действий:

1. Значения Х ранжируются в порядке возрастания или убывания.

2. Значения У располагаются в порядке соответствующем значениям Х.

3. Для каждого ранга У определяется число следующих за ним значений рангов, превышающих его величину. Результат записывается в столбец «+», суммируется и обозначается Р.

4. Для каждого ранга У определяется число следующих за ним меньших значений рангов. Результат записывается в столбец «–», суммируется и обозначается Q.

5. Определяется общая сумма S = P+Q.

 

Интерпретация коэффициентов Спирмена и Кендэлла аналогична интерпретации коэффициента корреляции Пирсона.

 

Пример 8.6. Рассчитаем значение коэффициента Кендэлла на основании данных примера 8.5

Решение:

 

Х У 1-й шаг 2-й шаг 3-й шаг «+» 4-й шаг «-»
1,5 1,3
2,4 1,5
8,6 2,4
1,3 3,3
3,3 3,5
4,0 4,0
5,1 5,1
6,1 6,1
3,5 7,1
7,1 8,6 - -
Итого - -   P=32 Q=-13

 

5-й шаг: S=P+Q=32+(-13)=19, тогда

 

Существенность коэффициента корреляции рангов Кэндэлла проверяется по формуле:

 

, (8.12)

где - коэффициент, определяемый по таблице нормальгого распределения для выбранного уровня значимости при больших п.

 

Коэффициент Кендэлла всегда меньше по значению, чем коэффициент Спирмена, точнее . Это соотношение выполняется при большом числе наблюдений, т.е п>30, и слабых либо умеренно тесных связях.

 

Если отдельные значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической от соответствующих номеров мест, которые определяются. Данные ранги называются связанными (или повторяющимися). Для случая связанных рангов есть особые скорректированные формулы для коэффициентов Спирмена и Кендэлла, однако на практике часто пользуются формулами приведенными выше.

 

Корреляция альтернативных признаков

 

Для исследования степени тесноты связи между качественными признаками могут быть использованы коэффициенты контингенции Пирсона, ассоциации Юла и взаимной сопряженности Пирсона.

В том случае, когда качественные признаки представлены в виде альтернативных (дихотомических), рассчитываются коэффициенты контингенции и ассоциации на основе четырехклеточных таблиц следующего вида:

 

a b
c d

 

Коэффициент контингенции: (8.13)

 

Коэффициент ассоциации: (8.14)

 

Значимость коэффициента ассоциации проверяется следующим образом:

 

, где (8.15)

 

(8.16)

 

Коэффициент ассоциации считается статистически значимым, если , где находится по таблице функции Лапласа при уровне значимости ά (обычно берется на уровне 5%).

 

Пример 8.7. В результате обследования работников предприятия получены следующие данные (чел.)

 

Образование Удовлетворены работой Не удовлетворены работой Итого
Высшее и среднее
Незаконченное среднее
Итого

 

Требуется оценить тесноту взаимосвязи между уровнем образования и удовлетворенностью работой с помощью коэффициентов контингенции и ассоциации.

Решение:

 

.

 

Коэффициенты контингенции и ассоциации изменяются в пределах [-1;+1], но величина коэффициента контингенции для тех же данных по абсолютной величине меньше величины коэффициента ассоциации, т.е .

 

В случае если каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи используют коэффициент взаимной сопряженности Пирсона.

Информация для оценки этой связи группируется в виде таблицы (mij – частоты взаимного сочетания двух качественных признаков).

 

Признаки A B C Итого
D m11 m12 m13 Σ m1j
E m21 m22 m22 Σ m2j
F m31 m32 m33 Σ m3j
Итого Σ mi1 Σ mi2 Σ mi3 Σ mij

 

Коэффициент взаимной сопряженности Пирсона определяется по формуле:

(8.17)

где - показатель средней квадратической сопряженности, рассчитываемый как

 

(8.18)

 

Интерпретация коэффициентов контингенции, ассоциации и взаимной сопряженности Пирсона аналогична интерпретации коэффициента корреляции Пирсона.

 

Пример 8.8. Для изучения влияния условий труда на взаимоотношения в коллективе было проведено выборочное обследование 250 работников предприятия, ответы которых распределились следующим образом:

 

Условия труда Взаимоотношения в коллективе Итого
Хорошие Удовлетворительные Неудовлетворительные
Соответствуют требованиям
Не полностью соответствуют
Не соответствуют
Итого

 

Рассчитать коэффициент взаимной сопряженности Пирсона.

Решение:

.

 

Множественная корреляция. Изменение экономических явлений происходит под влиянием не одного, а большого числа различных факторов. Для измерения тесноты корреляционной связи между результативным признаком и несколькими факторными признаками при линейной форме связи рассчитывается коэффициент множественной корреляции.

Коэффициент множественной корреляции, для случая двух факторных признаков x1 и x2 рассчитывается по формуле:

 

(8.19)

 

Множественный коэффициент корреляции изменяется в пределах [0;1] и численно не может быть меньше, чем любой из образующих его парных коэффициентов. Приближение R к единице свидетельствует о сильной зависимости между признаками.

Средняя квадратическая ошибка коэффициента множественной корреляции определяется по формуле:

(8.20)

 

Тогда, если , то с вероятностью близкой к 0,99 можно считать коэффициент множественной корреляции значимым.

 

Проверка значимости коэффициента множественной корреляции осуществляется так же по F-критерию Фишера. Для случая двух факторных признаков х1 и х2 он имеет вид:

 

(8.21)

 

Коэффициент множественной корреляции считается статистически значимым, если , где находится по таблице распределения Фишера с параметрами (а; 2; n – 3).

В ходе изучения множественной корреляции рассчитывают также частные коэффициенты корреляции. Частные коэффициенты корреляции характеризуют степень тесноты связи между двумя признаками при фиксированном значении всех остальных. Для случая двух факторных признаков x1 и x2 формулы будут иметь вид:

 

(8.22)

 

(8.23)

 

В первом случае исключено влияние факторного признака х2, а во втором х1. Значения парного и частного коэффициентов корреляции отличаются друг от друга, т.к. парный коэффициент характеризует связь между двумя признаками без учета влияния других признаков, а частный учитывает наличие и влияние других факторов.

Проверка значимости и расчет доверительных интервалов для частных коэффициентов корреляции аналогичны, как и для парных коэффициентов корреляции, с тем лишь отличием. Что число степеней свободы n определяется так: n = n - k., где k – порядок коэффициента частной корреляции.

 


Контрольные задания к теме 8

1. По следующим данным рассчитайте коэффициент корреляции Пирсона и сделайте выводы:

.

 

2. Следующая таблица представляет значения премий, выплаченных десятью страховыми обществами (Х), и их резервы для выплаты непредъявленных премий (Y).

X
Y

Оценить тесноту связи между выплачиваемыми премиями и резервами страховых обществ.

 

3. По группе акционерных коммерческих банков региона имеются следующие данные:

№ банка
Активы банка, млн. руб.
Прибыль, млн. руб. 39,6 17,8 12,7 14,9 4,0 15,5 6,4 10,1 3,4 13,4

 

Оценить тесноту связи между прибылью и активами банков.

 

4. По данным аудиторского отчета о деятельности 12 коммерческих банков построена следующая таблица:

№ банка
Кредитная ставка, %
Доходность от кредитных операций, %

Оценить степень тесноты связи между размером кредитной ставки и доходностью кредитных операций.

 

5. По однородным предприятиям имеются данные о количестве рабочих с профессиональной подготовкой и количестве бракованной продукции:

№ предприятия
Количество рабочих с проф. подготовкой, % 19,0 25,3 33,6 65,8 50,9 29,3 41,6 33,9 54,0 26,6
Количество бракованной продукции, % 17,0 15,6 13,5 7,0 7,9 9,2 8,0 14,8

Рассчитайте линейный коэффициент корреляции и проверьте его значимость.

 

6. У 8 учащихся колледжа зафиксировано следующее количество баллов, полученных за самостоятельные работы по математике (х) и по гуманитарным предметам (y).

 

Студент А Б В Г Д Е Ж З
X
Y

 

Оценить степень тесноты связи между успеваемостью по математике и гуманитарным предметам.

 

7. По результатам ранжирования стран по уровню эффективности экономики и степени политического риска, определите коэффициенты ранговой корреляции и сделайте выводы.

 

Показатель Ранг стран
А B C D K M P
Эффективность экономики
Степень политического риска

 

8. С помощью ранговых коэффициентов определите, существует ли связь между намерениями учащихся после окончания учебного года в зависимости от пола и от места проживания.

 

  Намерения учащихся Распределение учащихся
по полу по месту жительства
девушки юноши крупные города малые города
1. Продолжить обучение на дневном 79,4 71,8 75,5 80,7
2. Учиться и работать 10,4 13,0 11,6 8,8
3. Работать 3,9 7,6 6,0 3,8
4. Другое 0,8 1,3 1,1 0,3
5. Затрудняюсь ответить 5,5 6,3 5,8 6,4

Рассчитайте коэффициенты ранговой корреляции для данных, представленных в таблице. Сделайте выводы.

 

9. Экзаменационная сессия студентов-заочников по специальным дисциплинам характеризуется следующими данными:

 

  Положительные оценки Неудовлетворительные оценки Итого
Работают по специальности
Не работают по специальности
Итого

 

10. Оценка студентами профессиональных качеств преподавателей представлена в следующей таблице:

 

Критерии оценки качест- ва преподавателей Оценка Ито-го
высокая средняя низкая затрудняюсь ответить
Знание предмета
Умение обучать
Восприимчивость к новому
Способность к саморазвитию
Итого

 

Рассчитайте коэффициент взаимной сопряженности К. Пирсона.

.


 


[1] Составлено на основе Ниворожкина Л.И., Рудяга А.А., Федосова О.Н. Теория статистики: Справочные материалы, контрольные вопросы и задания. Учебно-метод. пособие/ Рост. гос. эконом. универ. «РИНХ» – Ростов-н/Д., 2005. – 186 с.

[2] Медиана обладает свойством: сумма абсолютных величин отклонений вариантов от медианы меньше, чем от любой другой величины, т.е. åïхi - Меï = min.

[3] Квантили не всегда совпадают с определенными вариантами. Квантиль – это либо вариант ряда, либо промежуточное значение между двумя соседними вариантами.

[4] Использование коэффициента вариации имеет смысл при изучении вариации признака, принимающего только положительные значения. Совершенно неправильно пользоваться V в случае измерения колеблемости признака, принимающего как положительные, так и отрицательные значения. Не имеет смысла, например, V, вычисленный для изучения колеблемости среднегодовой температуры воздуха, что особенно ясно при среднегодовой температуре близкой к нулю.

[5] Существует много других аналитических выражений коэффициента Джини, но в целях экономии места мы остановимся на одном.




Поиск по сайту:







©2015-2020 mykonspekts.ru Все права принадлежат авторам размещенных материалов.