Парная регрессия и корреляция

Paired regression and correlation
Шукуров И.А.
Цитировать:
Шукуров И.А. Парная регрессия и корреляция // Universum: технические науки : электрон. научн. журн. 2021. 5(86). URL: https://7universum.com/ru/tech/archive/item/11685 (дата обращения: 18.12.2024).
Прочитать статью:

 

АННОТАЦИЯ

На основе имеющейся статистики по группам одних и тех же хозяйствующих субъектов, расчета параметров a и b линейной парной регрессии методом наименьших квадратов оценена корреляция линейной связи с использованием коэффициента корреляции. Было оценено качество построенного эконометрического уравнения и проверена его надежность.

ABSTRACT

Based on the available statistics for groups of the same business entities, calculating the parameters a and b of linear pairwise regression using the least squares method, the correlation of the linear relationship is estimated using the correlation coefficient. The quality of the constructed econometric equation was assessed and its reliability was checked.

 

Ключевые слова: регрессия, корреляция, t-критерия Стьюдента, коэффициент детерминации.

Keywords: regression, correlation, Student’s criterion, coefficient of determination.

 

На основе имеющихся статистических данных по n группам однородных экономических объектов требуется [1]:

1) Используя МНК считаем параметры a и b линейной парной регрессии;

2) Оценим тесноту линейной связи с помощью показателя корреляции;

3) Оценим качество построенного уравнения с помощью коэффициента детерминации;

4) Оценим с помощью t-критерия Стьюдента статистическую значимость параметров регрессии и коэффициента корреляции на уровне значимости α=0,05;

5) Рассчитать 95% доверительные интервалы для параметров a и b;

6) Рассчитать прогнозное значение результативного признака, если прогнозное значение фактора составит 110% от его среднего уровня. Определить доверительный интервал прогноза при уровне значимости α=0,05;

7) Приходим к выводу.

Таблица 1.

Показатели стоимости обслуживания и время эксплуатации на экономических объектов

Стоимость тех.обслуживания, у (тыс. руб.)

5,3

5,2

6,0

5,7

6,6

6,8

8,1

6,9

10,3

4,0

2,5

Время эксплуатации, х (лет)

5

4

5

6

7

8

10

8

11

3

2

 

1) Используя МНК рассчитать параметры a и b линейной парной регрессии для расчета параметров уравнения линейной регрессии строим расчетную таблицу.

Таблица 2.

Корреляционная таблица на экономических объектов

 

x

y

yx

x2

y2

1

5

5,3

26,5

25

28,09

5,24

2

4

5,2

20,8

16

27,04

4,55

3

5

6

30

25

36

5,24

4

6

5,7

34,2

36

32,49

5,94

5

7

6,6

46,2

49

43,56

6,63

6

8

6,8

54,4

64

46,24

7,33

7

10

8,1

81

100

65,61

8,72

8

8

6,9

55,2

64

47,61

7,33

9

11

10,3

113,3

121

106,09

9,42

10

3

4

12

9

16

3,85

11

2

2,5

5

4

6,25

3,15

Итого

69

67,4

478,6

513

454,98

67,40

Среднее значение

6,27

6,13

43,51

46,64

41,36

6,13

2,6999

1,954

7,2893

3,818

 

;

.

Получено уравнение регрессии: .

2) Оценим тесноту линейной связи с помощью показателя корреляции:

Линейный коэффициент корреляции характеризует тесноту линейной связи между изучаемыми признаками. Его можно определить по следующей формуле[2]:

,

Вычислим:

Значения линейного коэффициента корреляции принадлежит промежутку [-1;1]. Связь между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока: менее 0,1 отсутствует линейная связь, 0,1 < rxy< 0,3: слабая; 0,3 < rxy< 0,5: умеренная;  0,5 < rxy< 0,7: заметная; 0,7 < rxy< 0,9: высокая; 0,9 < rxy< 1: весьма высокая;

3) Оценим качество построенного уравнения с помощью коэффициента детерминации:

Коэффициент детерминации: , где

- общая сумма квадратов,

 - факторная сумма квадратов,

- остаточная сумма квадратов

Таблица 3.

Детерминационний таблица на экономических объектов

x

y

1

5

5,3

5,24

0,68438

0,785001

0,003449

2

4

5,2

4,55

0,859835

2,503192

0,428862

3

5

6

5,24

0,016198

0,785001

0,575671

4

6

5,7

5,94

0,182562

0,036046

0,056366

5

7

6,6

6,63

0,223471

0,256327

0,001126

6

8

6,8

7,33

0,452562

1,445844

0,280588

7

10

8,1

8,72

3,891653

6,732586

0,386878

8

8

6,9

7,33

0,597107

1,445844

0,184647

9

11

10,3

9,42

17,41165

10,82981

0,777676

10

3

4

3,85

4,525289

5,19062

0,022807

11

2

2,5

3,15

13,15711

8,847283

0,426193

Итого

69

67,4

67,40

42,00182

38,85756

3,144263

 

Вычислим:

4) Оценим с помощью t-критерия Стьюдента статистическую значимость параметров регрессии и коэффициента корреляции на уровне значимости α=0,05 [3]:

Табличное значение -критерия для числа степеней свободы

 и  составит .

Стандартные ошибки коэффициентов регрессии:

,

где

- несмещенная оценка остаточной дисперсии.

Определим стандартные ошибки коэффициентов:

;

.

Наблюдаемые значения t-критерия Стьюдента:

Тогда

;

.

5) Рассчитаем 95% доверительные интервалы для параметров a и b:

Рассчитаем доверительные интервалы для параметров регрессии a и b. Для этого определим предельную ошибку для каждого показателя:

.

Доверительные интервалы  

  

6) Рассчитаем прогнозное значение результативного признака, если прогнозное значение фактора составит 110% от его среднего уровня. Определим доверительный интервал прогноза при уровне значимости α=0,05:

Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение срока эксплуатации составит:  лет, тогда прогнозное значение стоимости тех.обслуживания составит:  руб.

Ошибка прогноза составит:

.

Предельная ошибка прогноза, которая в  случаев не будет превышена, составит:

.

Доверительный интервал прогноза:

  тыс. руб.;  тыс. руб.

7) Выводы:

С увеличением времени эксплуатации на 1 год стоимость тех.обслуживания возрастает в среднем на 0,70 тыс. руб.

Для нашей задачи r=0,962, что подтверждает вывод, сделанный ранее, что связь между признаками прямая, а также указывает на весьма высокую взаимосвязь между стоимостью тех.обслуживания и  сроком эксплуатации. Положительная величина свидетельствует о прямой связи между изучаемыми признаками

Множественный коэффициент детерминации , показывает, что около 92,5% вариации зависимой переменной  учтено в модели и обусловлено влиянием включенного фактора  и на 7,5% — другими факторами, не включенными в модель.

Фактические значения t-статистики превосходят табличное значение:  поэтому параметры a, b и  не случайно отличаются от нуля, а статистически значимы.

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью  параметры a и b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.

Выполненный прогноз стоимости тех.обслуживания является надежным () и находится в пределах от 5,17 тыс. руб. до 7,96 тыс. руб.

 

Список литературы:

  1. Валентинов В.А. Эконометрика: Учебник. – М.: Издательско-торговая корпорация «Дашков и К˚», 2009. – 367 с.
  2. Доугерти К. Введение в эконометрику: Учебник. – М.: ИНФРА-М, 2007. –452 с.
  3. Елисеева. И.И., Курышева С.В. и др. Эконометрика: Учебник. – М.: Финансы и статистика, 2007. – 260 с.
  4. Ходиев. Б.Ю., Шодиев Т.Ш., Беркинов Б.Б. Эконометрика. Не учись. Т.: ТДИУ, 2017.-144 с.
Информация об авторах

ассистент кафедры Высшей математики, Самаркандский институт экономики и сервиса, Республика Узбекистан, г.Самарканд

Assistant at the Department of Higher Mathematics, Samarkand Institute of Economics and Service, Republic of Uzbekistan, Samarkand

Журнал зарегистрирован Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), регистрационный номер ЭЛ №ФС77-54434 от 17.06.2013
Учредитель журнала - ООО «МЦНО»
Главный редактор - Ахметов Сайранбек Махсутович.
Top