Мои Конспекты
Главная | Обратная связь


Автомобили
Астрономия
Биология
География
Дом и сад
Другие языки
Другое
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Металлургия
Механика
Образование
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Туризм
Физика
Философия
Финансы
Химия
Черчение
Экология
Экономика
Электроника

Шкалы измерения и техника корреляционного анализа

Классификация статистических связей

Ø По тесноте связи (трактовка производится в соответствии со значением коэффициента корреляции (см. шкалу Чеддока))

Значения коэффициента корреляции До ׀0,3׀ ׀0,3׀-׀0,5׀ ׀0,5׀- ׀0,7׀ ׀0,7׀- ׀0,9׀ До ׀0,99׀
Характеристика тесноты связи слабая умеренная заметная высокая (сильная) достаточно высокая

 

Ø По направлению:
прямая или обратная

Ø По аналитическому выражению:
линейная или нелинейная

Виды корреляционной зависимости

· Парная корреляция – линейная зависимость между двумя переменными

· Частная корреляция – линейная зависимость между двумя переменными при исключении влияния других

· Множественная корреляция - линейная зависимость между набором переменных

Шкалы измерения и техника корреляционного анализа

 

Возможность измерения связей и их содержательная интерпретация во многом зависит от того, в каких шкалах измерены исследуемые переменные.

Как уже было рассмотрено ранее, выделяют следующие шкалы:

• номинальные (классификационные, атрибутивные) шкалы

• порядковые (ранговые, ординальные) шкалы

• количественные ( метрические) шкалы

Для каждого типа переменных разработана своя логика корреляционного анализа, существуют свои коэффициенты корреляции и специфические особенности интерпретации.

 

Пример корреляционного анализа для данных, измеренных на количественной шкале:

Пусть имеются данные по 9 студентам:

Ø Признак (x) – количество пропущенных студентом занятий по дисциплине

Ø Признак (y) – количество заданий, верно решенных студентом на экзамене

Данные о числе пропущенных занятий и количестве заданий, верно решенных на экзамене
A B C D E F G H I
(X)
(Y)

Пример

Исследуем зависимость среднего значения (y) от признака (x)

Ясно, что такая объективная зависимость может существовать
(хотя и не функциональная)

Для анализа будет использовано 3 метода:

Пример

Метод 1. Метод приведения параллельных данных заключается в упорядочивании значений признаков по переменной x и анализе того, как соответственно меняются значения признака y. Это позволяет сделать предварительный вывод о направлении связи.

Данные о числе пропущенных занятий и количестве заданий, верно решенных на экзамене
C D G A I B H F E
(X)
(Y)

Преимущества метода 1:

  1. Простота исполнения.
  2. Дает представление о направлении связи.

Недостатки метода 1:

  1. Пригоден лишь для небольших массивов данных.
  2. Не дает представления о силе взаимосвязи.

Пример

Метод 2. Построение поля корреляции - графического изображения анализируемых данных в прямоугольной системе координат, где по оси располагается ОХ – независимая переменная, по ОУ – зависимая переменная.

Преимущества метода 2:

  1. Простота исполнения.
  2. Наглядность.
  3. Пригоден для любого числа наблюдений.
  4. Дает представление о направлении связи.
  5. Позволяет визуально диагностировать проблемы в исходной информации.

Недостатки метода:

  1. Не дает представления о силе взаимосвязи.

Пример

Метод 3. Расчет коэффициентов корреляции.

В случае линейной взаимосвязи между двумя КОЛИЧЕСТВЕННЫМИ переменными рассчитывают линейный коэффициент парной корреляции Пирсона (выписать доп. формулы коэффициента со стр. 197-198):

 

Пример

 

 

Пример

Делать выводы о тесноте и направлении связи пока преждевременно: нужно проверить значимость коэффициента корреляции (r)

• Гипотеза H0: истинное значение коэффициента корреляции (r) равно «0»

• Гипотеза H1: истинное значение коэффициента корреляции (r) отлично от «0», т.е. коэффициент статистически значим

• Для проверки значимости коэффициента корреляции (r) применяется T-критерий Стьюдента

Пример

Так как число наблюдений меньше 30, а коэффициент корреляции меньше 0,9 выберем следующую формулу: :

Расчет коэффициента корреляции позволил выявить, что между числом пропущенных занятий и количеством верно решенных заданий существует :

Ø Обратная (коэффициент корреляции (r) отрицательный)

Ø Сильная - смотрим таблицу Чеддока)

Ø Статистически значимая корреляционная взаимосвязь.