Бизнес-портал для руководителей, менеджеров, маркетологов, экономистов и финансистов

Поиск на AUP.Ru


Объявления

С.В. Гриненко
Т.В. Седова
Практикум по статистике

Предыдущая

Тема № 6. Статистическое изучение взаимосвязей

6.1. Методические указания

Исследуя природу, общество, экономику, необходимо считаться со взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания так или иначе определяется количественными характеристиками причинно-следственных связей между ними. Оценка наиболее существенных из них, а также воздействия одних факторов на другие является одной из основных задач статистики. Формы проявления взаимосвязей весьма разнообразны (рис. 27).
В наиболее общем виде задача статистики в области изучения взаимосвязей состоит в количественной оценке их наличия и направления, а также характеристике силы и формы влияния одних факторов на другие. Для ее решения применяются две группы методов, одна из которых включает в себя методы корреляционного анализа, а другая – регрессионный анализ. Ряд исследователей объединяет эти методы в корреляционно-регрессионный анализ (рис. 28).
Оценка тесноты связи между признаками предполагает определение меры соответствия вариации результативного признака от одного (при изучении парной зависимости) или нескольких (при изучении множественных зависимостей) факторных признаков. Показатели тесноты связи между признаками называют коэффициентами корреляции. Их выбор зависит от того, в каких шкалах измеряются признаки. Основные шкалы представлены на рис. 29.
Если в качестве исходной информации используется вся генеральная совокупность, а не данные выборки, то для оценки тесноты связи рассчитывают коэффициент парной линейной корреляции (рис. 30).
27
Рис. 27. Классификация статистических взаимосвязей (зависимостей)

28
Рис. 28. Методы корреляционно-регрессионного анализа

29
Рис. 29. Расчет коэффициентов тесноты связи

В случае наличия линейной и нелинейной зависимости между двумя признаками для измерения тесноты связи применяют корреляционное отношение (рис. 28).

30

Рис. 30. Расчет коэффициентов тесноты связи – количественная шкала

Статистической наукой разработаны методы, с помощью которых можно измерить связь между явлениями, не используя при этом количественные значения признака, а значит, и параметры распределения. Такие методы получили название непараметри-ческих.
Если изучается взаимосвязь двух качественных признаков, то используют комбинационное распределение единиц совокупности в форме так называемых таблиц взаимной сопряженности и рассчитывают коэффициенты ассоциации и контингенции. Обобщающие показатели, характеризующие тесноту связи между признаками и позволяющие сравнить проявление связи в разных совокупностях – это коэффициенты взаимной сопряженностиПирсона и Чупрова (рис. 31).
31
Рис. 31. Расчет коэффициентов тесноты связи – номинальная шкала

В социально-экономических исследованиях нередко встречаются ситуации, когда признак не выражается количественно, однако единицы совокупности можно упорядочить. Такое упорядочение единиц совокупности по значению признака называется ранжированием. При ранжировании каждой единице совокупности присваивается ранг, т.е. порядковый номер. При совпадении значения признака у различных единиц им присваивается объединенный средний порядковый номер.
Измерение связи между ранжированными признаками производится с помощью ранговых коэффициентов корреляцииСпирмена (r) и Кендэлла (t) (рис. 32). Эти методы применимы не только для качественных, но и для количественных показателей, особенно при малом объеме совокупности, так как непараметрические методы ранговой корреляции не связаны ни с какими ограничениями относительно характера распределения признака.
32
Рис. 32. Расчет коэффициентов тесноты связи – порядковая шкала

После выбора зависимой переменной и факторных признаков, сбора и подготовки информации, идентификации регрессионной модели рассчитываются параметры исследуемой зависимости при помощи ряда способов.
Наибольшее распространение получил способ наименьших квадратов, который был предложен немецким ученым К. Ф. Гауссом и французскими математиками А. М. Лежандром и П. С. Лапласом в первой четверти XIX в. Сущность этого способа заключается в том, что величина параметров уравнения регрессии должна быть такой, чтобы достигался минимум суммы квадратов отклонений между теоретическими (ух) и фактическими (у) значениями зависимого показателя.
Применение метода наименьших квадратов (МНК) для линейной зависимости – если моделью выбрано уравнение прямой представлено на рис. 33.
33
Рис. 33. Расчет параметров уравнения регрессии методом МНК

6.1.1. Примеры решения задач

Задание 1. На основе опроса 400 работников коммерческих структур и 400 работников бюджетной сферы получены результаты, представленные в табл. 15. Определить тесноту связи возможными методами.
Таблица 15
Результаты опроса


Работающие

Довольные своей заработной платой

Недовольные своей заработной платой

Итого

В коммерческих структурах

360

40

400

В бюджетных организациях

140

260

400

Итого

500

300

800

Решение:

f5

Задание 2. Имеются данные о распределении 200 молочных ферм области по производительности труда и себестоимости продукции (табл. 16.) Определить тесноту связи возможными методами.
Таблица 16
Распределение молочных ферм


Производительность

Высокая

Средняя

Низкая

Итого

Себестоимость

Высокая

10

10

30

50

Средняя

30

30

10

70

Низкая

50

20

10

80

Итого

90

60

50

200

Решение:
f6

Основываясь на том, что коэффициенты Пирсона и Чупрова меньше 0,50, можно сделать вывод об отсутствии связи между исследуемыми показателями.
Задание 3. Имеются следующие данные по 8 сахарным заводам о стоимости основных производственных фондов (x), млн руб., и суточной переработке свеклы (y), тыс. т. (табл. 17).
Найти уравнение регрессии и определить значимость его параметров.
Таблица 17
Стоимость основных производственных фондов


x

2,0

2,3

2,4

2,9

2,9

3,7

3,7

4,1

y

8,9

10,0

9,9

10,3

10,0

13,0

12,8

13,1

Решение:
Рассчитаем промежуточные значения и представим их в табл. 18.
Таблица 18
Промежуточные значения для решения задачи


Номер серии

Средневзвешенная цена, x

Объем продаж, y

xy

x2

y2

yx

1

2,00

8,90

17,80

4,00

79,21

8,88

2

2,30

10,00

23,00

5,29

100,00

9,52

3

2,40

9,90

23,76

5,76

98,01

9,73

4

2,90

10,30

29,87

8,41

106,09

10,79

5

2,90

10,00

29,00

8,41

100,00

10,79

6

3,70

13,00

48,10

13,69

169,00

12,48

7

3,70

12,80

47,36

13,69

163,84

12,48

8

4,10

13,10

53,71

16,81

171,61

13,33

Сумма

24,00

88,00

272,60

76,06

987,76

Среднее

3,00

11,00

34,07

9,50

123,47

 

Рассчитаем показатели корреляционно-регрессионного анализа совокупности (табл. 19).

f7

Оценка. Признаки в представленной совокупности обладают сильной прямой зависимостью – коэффициент регрессии 0,96 (близок к 1 и положительный). Построенная регрессионная модель в виде прямой линии имеете незначительной отклонение – ошибка 0,12, т.е. достаточно точная и может использоваться для целей планирования и прогнозирования.

 

Предыдущая

Объявления