Статистическое изучение связи социально-экономических явлений

Изучение современного производства показывает, что каждое явление находится в тесной взаимосвязи и взаимодействии.

При изучении конкретных зависимостей одни признаки выступают в качестве факторов, обусловливающих изменение других признаков. Признаки этой группы называются признаками-факторами (факторными признаками), а признаки, которые являются результатом влияния этих факторов, называются результативными (как на объем выпуска влияет техническая оснащенность производства, тогда объем производства – результативный, а техническая оснащенность – факторный признак). Различают два вида зависимостей между экономическими явлениями – функциональную и стохастическую. При функциональной связи каждой определенной системе значений факторных признаков соответствуют одно или несколько строго определенных значений результативного признака. Примеры функциональной зависимости можно привести из области физических явлений (S = v·t).

Стохастическая (вероятностная) связь проявляется только в массовых явлениях. В данной связи каждой определенной системе значений факторных признаков соответствует некоторое множество значений результативного признака. Изменение факторных признаков приводит не к строго определенному изменению результативного признака, а к изменению только распределения его значений. Это обусловлено тем, что зависимая переменная, кроме выделенной переменной, подвержена влиянию ряда неконтролируемых или неучтенных факторов, а также тем, что измерение переменных неизбежно сопровождается некоторыми случайными ошибками. Поскольку значения зависимой переменной подвержены случайному разбросу, они не могут быть предсказаны с достаточной точностью, а только указаны с определенной вероятностью (число бракованных деталей за смену, количество простоев за смену и т.д.).

Стохастическую связь называют корреляционной. Корреляция в широком смысле слова означает связь, соотношение между объективно существующими явлениями и процессами. Регрессия – это частный случай корреляции. В то время, как в корреляционном анализе оценивается сила стохастической связи, в регрессионном анализе исследуется ее форма, т.е. находится уравнение корреляционной связи (уравнение регрессии).

Рассмотрим различные виды корреляции и регрессии.

По числу переменных различают регрессию:

1) парную – регрессия между двумя переменными (прибыль производительность труда);

2) множественную – регрессия между зависимой переменной y и несколькими переменными (производительность труда уровень механизации производства, квалификации рабочих).

Относительно формы зависимости различают:

линейную регрессию; нелинейную регрессию.

В зависимости от характера регрессии различают:

1) прямую регрессию. Она имеет место, если с увеличением или уменьшением значений факторных переменных значения результативной переменной также увеличиваются или уменьшаются;

2) обратную регрессию. В этом случае с увеличением или уменьшением значений факторного признака результативный признак уменьшается или увеличивается.

Относительно типа соединений явлений различают:

1) непосредственную регрессию. В этом случае явления соединены непосредственно между собой (прибыль затраты);

2) косвенную регрессию. Она имеет место тогда, если факторная и результативная переменная не состоят непосредственно в причинно-следственных отношениях и факторная переменная через какую-то другую переменную действует на результативную переменную (число пожаров и урожайность зерновых (метеорологические условия));

3) ложная или абсурдная регрессия. Она возникает при формальном подходе к исследуемым явлениям. В результате можно придти к ложным и даже бессмысленным зависимостям (число импортируемых фруктов и рост дорожно-транспортных происшествий со смертельным исходом).

Аналогична классификация и корреляции.

Изучение взаимозависимостей в экономике имеет большое значение. Статистика не только отвечает на вопрос о реальном существовании связи между явлениями, но и дает количественную характеристику этой зависимости. Зная характер зависимости одного явления от другого, можно объяснить причины и размеры изменений в явлении, а также планировать необходимые мероприятия для дальнейшего его изменения. Чтобы результаты корреляционного анализа нашли практическое применение и дали желаемый результат, должны выполняться определенные требования:

1) однородность единиц, подвергающихся корреляционному анализу (предприятия выпускают однотипную продукцию, одинаковый характер технологического процесса и тип оборудования);

2) достаточное число наблюдений;

3) включаемые в исследование факторы должны быть независимы друг от друга.

Для исследования функциональных связей применяются балансовый и индексный методы. Для изучения стохастических связей используют метод параллельных рядов, метод аналитических группировок, дисперсионный анализ и анализ регрессий и корреляций.

Простейшим приемом обнаружения связей является сопоставление двух параллельных рядов. Сущность метода состоит в том, что сначала показатели, характеризующие факторный признак, ранжируются, а затем параллельно им располагаются соответствующие показатели результативного признака. Сравнение построенных таким образом рядов дает возможность не только подтвердить само наличие связи, но и выявить ее направление.

В случае, когда сравниваемые ряды состоят из большого числа единиц, направления связи для разных единиц может оказаться различным. В этом случае целесообразнее воспользоваться корреляционными таблицами. В корреляционной таблице факторный признак (х) располагают в строках, а результативный (у) – в столбцах. Числа, расположенные на пересечении строк и столбцов таблицы, показывают частоту повторения данного сочетания х и у. Построение корреляционной таблицы начинают с группировки единиц наблюдения по значениям факторного и результативного признаков. Если частоты в корреляционной таблице расположены по диагонали из левого верхнего угля в правый нижний угол, то можно предположить наличие прямой корреляционной зависимости. Если же частоты расположены по диагонали справа налево, то предполагают наличие обратной связи между признаками.

Другим методом обнаружения связи является построение групповой таблицы (метод аналитических группировок). Совокупность значений фактора х разбивают на группы и по каждой группе вычисляют среднее значение результативного признака. Предполагается, что при достаточно большом числе наблюдений в каждой группе влияние прочих случайных факторов при расчете групповой средней будет взаимопогашаться и яснее выявится зависимость результативного признака от факторного и, следовательно, различия в величине средних будут связаны только с различиями в величине данного факторного признака. Если бы связи между факторным и результативным признаком не было, то все групповые средние были бы приблизительно одинаковы по величине.

Простейшим показателем тесноты связи является коэффициент корреляции знаков (коэффициент Г.Фехнера):

,

где         – число совпадений знаков отклонений индивидуальной величины от средней;

– число несовпадений знаков отклонений индивидуальной величины от средней.

Этот коэффициент позволяет получить представление о направлении связи и приблизительную характеристику ее тесноты. Для его расчета вычисляют средние значения результативного и факторного признаков, а затем проставляют знаки отклонений для всех значений взаимосвязанных признаков Кф = [-1;+1]. Если знаки всех отклонений совпадут, то и Кф = 1 – прямая связь, если знаки всех отклонений будут разными, то Кф = — 1, что свидетельствует о наличии обратной связи.

Таблица 28

Численность рабочих и балансовая прибыль

Численность рабочих, чел.

Балансовая прибыль, тыс.руб.

Знак отклонений индивидуальной величины признака от средней

Совпадение (a), несовпадение (b)

304

-258

+

b

269

459

+

+

a

212

261

a

165

604

+

b

141

356

+

b

чел.

тыс. руб.

, таким образом, между признаками существует слабая обратная связь.

Для приблизительной оценки направления и тесноты связи между признаками, представленными двумя рядами, можно также использовать коэффициент корреляции рангов. При определении коэффициента корреляции рангов значения х ранжируются, а затем ранжируются и соответствующие им значения у. В результате получаем ранги, т.е. места, номера единиц совокупности в упорядоченном ряду. При этом в случае наличия одинаковых вариантов каждому из них присваивается среднее арифметическое значение их рангов.

Коэффициент ранговой корреляции Спирмена:

,

где        d – разность между рангами соответствующих величин двух признаков;

n – число единиц в ряду.

Коэффициент корреляции рангов принимает значения [-1; 1]. Если – тесная прямая связь, – тесная обратная связь, – связь отсутствует. Коэффициент корреляции рангов имеет определенные преимущества перед другими характеристиками направления и тесноты связи: его можно определять при исследовании данных, которые не поддаются нумерации, но ранжируются (оттенки, качество).

Для числовой характеристики тесноты связи могут быть использованы показатели вариации результативного признака: общая его дисперсия и межгрупповая дисперсия ().

Коэффициент ранговой корреляции Кендэла:

,

где        q – число рангов, расположенных в обратном порядке.

В практике статистических исследований часто приходится анализировать альтернативные распределения, когда совокупность распределяется по каждому признаку на две группы с противоположными характеристиками. Тесноту связи в этом случае можно оценить с помощью коэффициента контингенции:

.

Таблица 29

Зависимость успеваемости студентов от пола

Контингент студентов

Всего

сдавших экзамены

не сдавших экзамены

женщины

a = 25

b = 2

a + b = 27

мужчины

c = 20

d = 3

c + d = 23

Итого

a + c = 45

b + d = 5

50

.

Следовательно, между полом студента и его успеваемостью связь практически отсутствует.

Коэффициент ассоциации рассчитывается следующим образом:

.

Рассмотренные ранее статистические методы исследования взаимосвязей часто оказываются недостаточными, ибо они не позволяют выразить имеющуюся связь в виде определенного математического уравнения. Методы параллельных рядов и аналитических группировок эффективны лишь при малом числе факторных признаков, в то время, как социально-экономические явления складываются обычно под воздействием множества причин. Эти ограничения устраняет метод анализа корреляций и регрессий.

Метод анализа корреляций и регрессий заключается в построении и анализе экономико-математической модели в виде уравнения регрессии, выражающего зависимость явления от определяющих его факторов. Например, зависимость объема производства (у) (млн. руб.) от его технической оснащенности (х) (%) выражается следующей зависимостью:

.

Можно предполагать, что с увеличением технической оснащенности на 1%, объем производства увеличится в среднем на 21,4 млн. руб.

Метод анализа корреляций и регрессий состоит из следующих этапов:

предварительный анализ; сбор информации и ее первичная обработка; построение модели (уравнения регрессии); оценка и анализ модели.

На первом этапе необходимо в общем виде сформулировать задачу исследования (изучение влияния различных факторов на уровень производительности труда). Далее следует определить методику измерения результативного показателя (производительность труда может быть определена натуральным, трудовым или стоимостным методами). Необходимо также определить число факторов, оказывающих наиболее существенное влияние на формирование результативного признака.

На этапе сбора и обработки информации исследователю необходимо помнить, что изучаемая совокупность должна быть достаточно большой по объему. Исходные данные должны быть качественно и количественно однородны.

При построении корреляционной модели (уравнения регрессии) возникает вопрос о типе аналитической функции, характеризующей механизм взаимосвязи между признаками. Эта связь может быть выражена:

прямой линией                                ; параболой второго порядка                ; гиперболой                                        ; показательной функцией                         и др.

То есть, возникает вопрос о выборе формы связи. По виду эмпирической регрессии предполагают, какой тип кривой может быть описан. Далее решается уравнение регрессии. Затем с помощью специальных критериев оценивается их адекватность и выбирается та форма связи, которая обеспечивает наилучшее приближение и достаточную статистическую достоверность. Выбрав форму связи и построив уравнение регрессии в общем виде, необходимо найти численное значение его параметров. Для нахождения параметров используют способ наименьших квадратов. Суть его состоит в следующем:

,                

.

Находятся частные производные данного выражения по и и приравниваются к нулю. После преобразований получим систему нормальных уравнений:

Решение этой системы в общем виде дает следующие значения параметров:

.

После нахождения параметров, получаем уравнение регрессии, по которому находим теоретические частоты для каждого значения .

Можно получить и иным способом. Разделим нормальное уравнение на и получим:

.

Коэффициент регрессии может быть представлен следующим образом:

.

Коэффициент регрессии показывает меру влияния изменения объясняющей переменной х на зависимую переменную у. Постоянная регрессии определяет точку пересечения прямой регрессии с осью ординат. После определения оценок параметров регрессии и , а также значений определим случайную переменную . Она характеризует отклонение переменной от величины .

При линейной форме связи показателем ее тесноты выступает линейный коэффициент корреляции:

,

;                ;

.

Коэффициент корреляции принимает значения [-1; +1]: r = –1 – связь обратная; r = +1 – прямая.

Зная линейный коэффициент корреляции можно определить коэффициент регрессии () в уравнении регрессии

,        тогда                .

Контрольные вопросы

Сущность стохастической взаимосвязи между явлениями. Что такое корреляция? Приведите классификацию регрессии. Основные методы обнаружения взаимосвязей между явлениями. Как построить корреляционную таблицу? В каких случаях рассчитывается коэффициент ассоциации? Основные этапы корреляционно-регрессионного анализа. Как определить линейный коэффициент корреляции?