Пятница, 28 марта, 2025

Понятие корреляционного и регрессионного анализа

Для решения задач экономического анализа и прогнозирования очень часто используются статистические, отчетные или наблюдаемые данные. При этом полагают, эти данные являются значениями случайной величины.

Случайной величиной называется переменная величина, которая в зависимости от случая принимает различные значения с некоторой вероятностью. Закон распределения случайной величины показывает частоту ее тех или иных значений в общей их совокупности.

При исследовании взаимосвязей между экономическими показателями на основе статистических данных, часто между ними наблюдается стохастическая зависимость. Она проявляется в том, что изменение закона распределения одной случайной величины происходит под влиянием изменения другой. Взаимосвязь между величинами может быть полной (функциональной) и неполной (искаженной другими факторами).

Пример функциональной зависимости – выпуск продукции и ее потребление в условиях дефицита.

Неполная зависимость наблюдается, например, между стажем рабочих и их производительностью труда. Обычно рабочие с большим стажем работы работают лучше молодых, но под влиянием дополнительных факторов – образование, здоровье и т.д. эта зависимость может быть искажена.

Раздел математической статистики, посвященный изучению взаимосвязей между случайными величинами называется корреляционным анализом. Основная задача корреляционного анализа – это установление характера и тесноты связи между результативными (зависимыми) и факторными (независимыми) показателями (признаками) в данном явлении или процессе. Корреляционную связь можно обнаружить только при массовом сопоставлении фактов.

Характер связи между показателями определяется по корреляционному полю. Если Y — зависимый признак, а Х — независимый, то отметив каждый случай X(i) с координатами xi и yi получим корреляционное поле.

Теснота связи определяется с помощью коэффициента корреляции, который рассчитывается специальным образом и лежит в интервалах от минус единицы до плюс единицы. Если значение коэффициента корреляции лежит в интервале от 1 до 0,9 по модулю, то отмечается очень сильная корреляционная зависимость. В случае, если значение коэффициента корреляции лежит в интервале от 0,9 до 0,6, то говорят, что имеет место слабая корреляционная зависимость. Наконец, если значение коэффициента корреляции находится в интервале от — 0,6 до 0,6, то говорят об очень слабой корреляционной зависимости или полной ее отсутствии.

Таким образом, корреляционный анализ применяется для нахождения характера и тесноты связи между случайными величинами.

Регрессионный анализ своей целью имеет вывод, определение (идентификацию) уравнения регрессии, включая статистическую оценку его параметров. Уравнение регрессии позволяет найти значение зависимой переменной, если величина независимой или независимых переменных известна.

Практически, речь идет о том, чтобы, анализируя множество точек на графике (т.е. множество статистических данных), найти линию, по возможности, точно отражающую заключенную в этом множестве закономерность (тренд, тенденцию) – линию регрессии.

По числу факторов различают одно-, двух — и многофакторные уравнения регрессии.

По характеру связи однофакторные уравнения регрессии подразделяются на:

а) линейные:

Понятие корреляционного и регрессионного анализаПонятие корреляционного и регрессионного анализа ,

где X – экзогенная (независимая) переменная;

Y – эндогенная (зависимая, результативная) переменная;

a, b – параметры.

б) степенные:

Понятие корреляционного и регрессионного анализаПонятие корреляционного и регрессионного анализа

в) показательные:

Понятие корреляционного и регрессионного анализа

г) прочие.

Определение параметров линейного однофакторного уравнения регрессии

Пусть у нас имеются данные о доходах (X) и спрос на некоторый товар (Y) за ряд лет (n)

ГОД

n

ДОХОД

X

СПРОС

Y

1

x1

y1

2

x2

y2

3

x3

y3

n

xn

yn

Предположим, что между X и Y существует линейная взаимосвязь, т.е.

Понятие корреляционного и регрессионного анализа

Для того, чтобы найти уравнение регрессии, прежде всего нужно исследовать тесноту связи между случайными величинами X и Y, т.е. корреляционную зависимость.

Пусть:

xПонятие корреляционного и регрессионного анализа, хПонятие корреляционного и регрессионного анализа, . . . ,хn — совокупность значений независимого, факторного признака;

yПонятие корреляционного и регрессионного анализа, yПонятие корреляционного и регрессионного анализа. . . ,yn – совокупность соответствующих значений зависимого, результативного признака;

n – количество наблюдений.

Для нахождения уравнения регрессии вычисляются следующие величины:

Средние значения

Понятие корреляционного и регрессионного анализа для экзогенной переменной.

Понятие корреляционного и регрессионного анализа для эндогенной переменной$

2. Отклонения от средних величин

Понятие корреляционного и регрессионного анализа, Понятие корреляционного и регрессионного анализа$

Величины дисперсии и среднего квадратичного отклонения

Понятие корреляционного и регрессионного анализа, Понятие корреляционного и регрессионного анализа .

Понятие корреляционного и регрессионного анализа Понятие корреляционного и регрессионного анализа

Величины дисперсии и среднего квадратичного отклонения характеризуют разброс наблюдаемых значений вокруг среднего значения. Чем больше дисперсия, тем больше разброс.

Вычисление корреляционного момента (коэффициента ковариации):

Понятие корреляционного и регрессионного анализа

Корреляционный момент отражает характер взаимосвязи между x и y. Если Понятие корреляционного и регрессионного анализа, то взаимосвязь прямая. Если Понятие корреляционного и регрессионного анализа, то взаимосвязь обратная.

Коэффициент корреляции вычисляется по формуле:

Понятие корреляционного и регрессионного анализа.

Доказано, что коэффициент корреляции находится в интервале от минус единицы до плюс единицы (Понятие корреляционного и регрессионного анализа). Коэффициент корреляции в квадрате (Понятие корреляционного и регрессионного анализа) называется коэффициентом детерминации.

Если Понятие корреляционного и регрессионного анализа, то вычисления продолжаются.

Вычисления параметров регрессионного уравнения.

Коэффициент b находится по формуле:

Понятие корреляционного и регрессионного анализа

После чего можно легко найти параметр a:

Понятие корреляционного и регрессионного анализа

Коэффициенты a и b находятся методом наименьших квадратов, основная идея которого состоит в том, что за меру суммарной погрешности принимается сумма квадратов разности (остатков) между фактическими значениями результативного признака Понятие корреляционного и регрессионного анализа и его расчетными значениями Понятие корреляционного и регрессионного анализа, полученными при помощи уравнения регрессии

Понятие корреляционного и регрессионного анализа.

При этом величины остатков находятся по формуле:

Понятие корреляционного и регрессионного анализа, где

Понятие корреляционного и регрессионного анализафактическое значение y;

Понятие корреляционного и регрессионного анализа расчетное значение y.

Пример. Пусть у нас имеются статистические данные о доходах (X) и спросе (Y). Необходимо найти корреляционную зависимость между ними и определить параметры уравнения регрессии.

ГОД

n

ДОХОД

X

СПРОС

Y

1

10

6

2

12

8

3

14

8

4

16

10,3

5

18

10,5

6

20

13

Предположим, что между нашими величинами существует линейная зависимость.

Тогда расчеты лучше всего выполнить в Excel, используя статистические функции;

СРЗНАЧ – для вычисления средних значений;

ДИСП – для нахождения дисперсии;

СТАНДОТКЛОН – для определения среднего квадратичного отклонения;

КОРЕЛЛ – для вычисления коэффициента корреляции.

Корреляционный момент можно вычислить, найдя отклонения от средних значений для ряда X и ряда Y , затем при помощи функции СУММПРОИЗВ определить сумму их произведений, которую необходимо разделить на n-1.

Результаты вычислений можно свести в таблицу.

Параметры линейного однофакторного уравнения регрессии

Показатели

X

Y

Среднее значение

15

9,3

Дисперсия

14

6,08

Среднее квадр. отклонение

3,7417

2,4658

Корреляционный момент

8,96

Коэффициент корреляции

0,9712

Параметры

b=0,64

a = — 0,3

В итоге наше уравнение будет иметь вид:

y = — 0.3 + 0.64x

Используя это уравнение, можно найти расчетные значения Y и построить график (рис. 2.1).

Понятие корреляционного и регрессионного анализа

Рис. 2.1. Фактические и расчетные значения Понятие корреляционного и регрессионного анализа

Ломаная линия на графике отражает фактические значения Y, а прямая линия построена с помощью уравнения регрессии и отражает тенденцию изменения спроса в зависимости от дохода.

Однако встает вопрос, насколько значимы параметры a и b? Какова величина погрешности?

Оценка величины погрешности линейного однофакторного уравнения

Обозначим разность между фактическим значением результативного признака и его расчетным значением как Понятие корреляционного и регрессионного анализа:

Понятие корреляционного и регрессионного анализа, где

Понятие корреляционного и регрессионного анализафактическое значение y;

Понятие корреляционного и регрессионного анализа расчетное значение y,

Понятие корреляционного и регрессионного анализа – разность между ними.

В качестве меры суммарной погрешности выбрана величина:

Понятие корреляционного и регрессионного анализа .

Для нашего примера S = 0.432.

Поскольку Понятие корреляционного и регрессионного анализа (среднее значение остатков) равно нулю, то суммарная погрешность равна остаточной дисперсии:

Остаточная дисперсия находится по формуле:

Понятие корреляционного и регрессионного анализа

Для нашего примераПонятие корреляционного и регрессионного анализа. Можно показать, что

Понятие корреляционного и регрессионного анализа .

Если Понятие корреляционного и регрессионного анализа Понятие корреляционного и регрессионного анализато Понятие корреляционного и регрессионного анализа

Понятие корреляционного и регрессионного анализа то Понятие корреляционного и регрессионного анализа

Таким образом, Понятие корреляционного и регрессионного анализа .

Легко заметить, что если Понятие корреляционного и регрессионного анализа, то

Понятие корреляционного и регрессионного анализа

Это соотношение показывает, что в экономических приложениях допустимая суммарная погрешность может составить не более 20% от дисперсии результативного признака Понятие корреляционного и регрессионного анализа.

Стандартная ошибка уравнения находится по формуле:

Понятие корреляционного и регрессионного анализа, где

Понятие корреляционного и регрессионного анализа – остаточная дисперсия. В нашем случае Понятие корреляционного и регрессионного анализа.

Относительная погрешность уравнения регрессии вычисляется как:

Понятие корреляционного и регрессионного анализа

где Понятие корреляционного и регрессионного анализа стандартная ошибка;

Понятие корреляционного и регрессионного анализа – среднее значение результативного признака.

В нашем случае Понятие корреляционного и регрессионного анализа = 7.07%.

Если величина Понятие корреляционного и регрессионного анализа мала и отсутствует автокорреляция остатков, то прогнозные качества оцененного регрессионного уравнения высоки.

Стандартная ошибка коэффициента b вычисляется по формуле:

Понятие корреляционного и регрессионного анализа

В нашем случае она равна Понятие корреляционного и регрессионного анализа.

Для вычисления стандартной ошибки коэффициента a используется формула:

Понятие корреляционного и регрессионного анализа

В нашем примере Понятие корреляционного и регрессионного анализа.

Стандартные ошибки коэффициентов используются для оценивания параметров уравнения регрессии.

Коэффициенты считаются значимыми, если

Понятие корреляционного и регрессионного анализа

В нашем примере Понятие корреляционного и регрессионного анализа

Коэффициент а не значим, т.к. указанное отношение больше 0.5, а относительная погрешность уравнения регрессии слишком высока – 26.7%.

Стандартные ошибки коэффициентов используются также для оценки статистической значимости коэффициентов при помощи t – критерия Стьюдента. Значения t – критерия Стьюдента содержатся в справочниках по математической статистике. В таблице 2.1 приводятся его некоторые значения.

Далее находятся максимальные и минимальные значения параметров (Понятие корреляционного и регрессионного анализа) по формулам:

Понятие корреляционного и регрессионного анализа

Таблица 2.1

Некоторые значения t – критерия Стьюдента

Степени свободы

Уровень доверия (с)

(n-2)

0,90

0,95

1

6,31

12,71

2

2,92

4,30

3

2,35

3,18

4

2,13

2,78

5

2,02

2,57

Для нашего примера находим:

Понятие корреляционного и регрессионного анализаПонятие корреляционного и регрессионного анализа

Понятие корреляционного и регрессионного анализаПонятие корреляционного и регрессионного анализа

Если интервал (Понятие корреляционного и регрессионного анализа) достаточно мал и не содержит ноль, то коэффициент b является статистически значимым на с – процентном доверительном уровне.

Аналогично находятся максимальные и минимальные значения параметра а. Для нашего примера:

Понятие корреляционного и регрессионного анализа

Коэффициент а не является статистически значимым, т.к. интервал (Понятие корреляционного и регрессионного анализа) велик и содержит ноль.

Вывод: полученные результаты не являются значимыми и не могут быть использованы для прогнозных расчетов. Ситуацию можно поправить следующими способами:

а) увеличить число n;

б) увеличить количество факторов;

в) изменить форму уравнения.

Проблема автокорреляции остатков. Критерий Дарбина-Уотсона

Часто для нахождения уравнений регрессии используются динамические ряды, т.е. последовательность экономических показателей за ряд лет (кварталов, месяцев), следующих друг за другом.

В этом случае имеется некоторая зависимость последующего значения показателя, от его предыдущего значения, которое называется автокорреляцией. В некоторых случаях зависимость такого рода является весьма сильной и влияет на точность коэффициента регрессии.

Пусть уравнение регрессии построено и имеет вид:

Понятие корреляционного и регрессионного анализа

Понятие корреляционного и регрессионного анализа – погрешность уравнения регрессии в год t.

Явление автокорреляции остатков состоит в том, что в любой год t остаток Понятие корреляционного и регрессионного анализа не является случайной величиной, а зависит от величины остатка предыдущего года Понятие корреляционного и регрессионного анализа. В результате при использовании уравнения регрессии могут быть большие ошибки.

Для определения наличия или отсутствия автокорреляции применяется критерий Дарбина-Уотсона:

Понятие корреляционного и регрессионного анализа.

Возможные значения критерия DW находятся в интервале от 0 до 4. Если автокорреляция остатков отсутствует, то DW≈2.

Построение уравнения степенной регрессии

Уравнение степенной агрессии имеет вид:

Понятие корреляционного и регрессионного анализа, где

a, b – параметры, которые определяются по данным таблицы наблюдений.

Таблица наблюдений составлена и имеет вид:

x

x1

x2

xn

y

y1

y2

yn

Прологарифмируем исходное уравнение и в результате получим:

Понятие корреляционного и регрессионного анализаln y = ln a + b⋅ln x .

Обозначим ln y через Понятие корреляционного и регрессионного анализа, ln a как Понятие корреляционного и регрессионного анализа, а ln x как Понятие корреляционного и регрессионного анализа.

В результате подстановки получим:

Понятие корреляционного и регрессионного анализа

Данное уравнение есть ничто иное, как уравнение линейной регрессии, параметры которого мы умеем находить.

Для этого прологарифмируем исходные данные:

ln x

ln x1

ln x2

ln xn

ln y

ln y1

ln y2

ln yn

Далее необходимо выполнить известные нам вычислительные процедуры по нахождению коэффициентов a и b, используя прологарифмированные исходные данные. В результате получим значение коэффициента b и Понятие корреляционного и регрессионного анализа. Параметр a можно найти по формуле:

Понятие корреляционного и регрессионного анализа.

В этих же целях можно воспользоваться функцией EXP в Excel.

Двухфакторные и многофакторные уравнения регрессии

Линейное двухфакторное уравнение регрессии имеет вид:

Понятие корреляционного и регрессионного анализа,

где Понятие корреляционного и регрессионного анализа— параметры;

Понятие корреляционного и регрессионного анализа – экзогенные переменные;

y – эндогенная переменная.

Идентификацию этого уравнения лучше всего производить с использованием функции Excel ЛИНЕЙН.

Степенное двухфакторное уравнение регрессии имеет вид:

Понятие корреляционного и регрессионного анализа

где Понятие корреляционного и регрессионного анализа— параметры;

Понятие корреляционного и регрессионного анализа – экзогенные переменные;

Y – эндогенная переменная.

Для нахождения параметров этого уравнения его необходимо прологарифмировать. В результате получим:

Понятие корреляционного и регрессионного анализаПонятие корреляционного и регрессионного анализа .

Идентификацию этого уравнения также лучше всего производить с использованием функции Excel ЛИНЕЙН. Следует помнить, что мы получим не параметр a, а его логарифм, которое следует преобразовать в натуральное число.

Линейное многофакторное уравнения регрессии имеет вид:

Понятие корреляционного и регрессионного анализа

где Понятие корреляционного и регрессионного анализаn — параметры;

Понятие корреляционного и регрессионного анализаn – экзогенные переменные;

y – эндогенная переменная.

Идентификацию этого уравнения также лучше всего производить с использованием функции Excel ЛИНЕЙН.

Актуальное

Экономика и управление регионом как наука: предмет, методы и задачи научной дисциплины

В современных условиях возрастает роль территориальных аспектов развития экономических...

Понятие и основные элементы методологии планирования и прогнозирования

Под методологией планирования и прогнозирования понимают систему подходов, принципов,...

«Функциональные взаимосвязи в открытой экономике»

1. Макроэкономика состоит из четырех основных секторов экономической деятельности...

Основные экономические характеристики отрасли

Анализ общей ситуации и конкуренции в отрасли начинается с...

Международная миграция рабочей силы: сущность, формы, факторы

В условиях возрастания интернационализации общественной жизни все более значительное...
Темы

Страны переселенческого капитализма

К ним относятся: Австралия, Новая Зеландия, ЮАР и Израиль....

МОДЕЛЬ СОЦИАЛЬНО-ЭКОНОМИЧЕСКОГО РАЗВИТИЯ ГЕРМАНИИ

Экономической системой современной Германии является социальное рыночное хозяйство, которое...

Представители неоклассической школы

Вслед за А.Смитом и К.Марксом механизмы рыночной конкуренции рассматривали...

Классификация конкурентных преимуществ

Конкурентное преимущество системы (компании, отрасли, страны) – какая-либо эксклюзивная...

Третий этап в развитии социологии

Третий этап (с середины 80-х годов по настоящее время)...

Ключевые факторы успеха в конкурентной борьбе

Ключевые факторы успеха (КФУ) – это элементы, обеспечивающие успех...

Мировое сообщество и различные группы составляющих его государств

Структурирование мирового хозяйства по социально-экономическим признакам предполагает выделение в...
Статьи по теме

Популярные категории