Бизнес-портал для руководителей, менеджеров, маркетологов, экономистов и финансистов

Поиск на AUP.Ru


Объявления

Т.В. Чернова
Межрегиональная дифференциация денежных доходов населения

Ростов н/Д: Изд-во СКНЦ ВШ, 2002. - 192 с.

Предыдущая

3. Статистическая оценка региональной дифференциации денежных доходов населения

3.1. Методологические и теоретические предпосылки использования факторного анализа

На среднедушевые доходы населения региона влияют различные факторы, которые характеризуются системой показателей, сгруппированных нами по природе их формирования – на две, а по характеру их влияния на денежные доходы – четыре основные группы. Большинство рассматриваемых факторов, влияющих на процесс формирования доходного неравенства, неоднородны и несоизмеримы как по своей физической природе, так и своему удельному весу в совокупном влиянии на дифференциацию доходов. Действие одних можно охарактеризовать как определяющее основную тенденцию развития процесса дифференциации, действие других как менее существенное. Системный подход к изучению причин дифференциации денежных доходов на региональном уровне предполагает максимально возможный учет совокупности переменных, характеризующих предмет исследования и взаимосвязи между ними. Но при этом стоит проблема выбора, с одной стороны, необходимого числа переменных, а с другой – достаточного для описания явления, т.к. между количеством переменных и трудоемкостью анализа существует прямая зависимость.

В действительности, на процесс формирования денежных доходов населения и их вариацию в региональном аспекте влияет гораздо больше факторов, чем было выделено и рассмотрено в предыдущей главе. Однако система показателей, взятая за основную информационную базу, требует дальнейшей «фильтрации», отбора наиболее существенных и относительно независимых функциональных характеристик. 

По своей сути, системный подход есть инструмент, способ рассмотрения сложных процессов и явлений, представляющий собой определенную последовательность действий аналитика с целью отделения существенных свойств и отношений элементов в системе от несущественных и переход в дальнейшем к более глубокому изучению основных системообразующих факторов. Системный подход к изучению сложных социально-экономических явлений может осуществляться на базе многомерного анализа.

Теория и практика использования многомерного анализа в системных исследованиях больших массивов социально-экономической информации позволяет провести существенное сжатие информации на основе агрегирования данных. Преобразованный массив отображается меньшим числом наиболее информативных признаков и становится обозримее и удобнее для анализа. Это достигается посредством определения дублирующей информации, вызываемой сильно взаимосвязанными признаками, выделением неинформативных признаков, незначительно меняющихся при переходе от одного объекта к другому, и, наконец, определением возможности агрегирования информации по некоторым признакам. При этом сохранение степени аналитичности полученных данных составляет решающее требование к результатам преобразования. Они должны с достаточной точностью воспроизводить свойства вариации признаков, содержащихся в исходном массиве.

Многомерный анализ включает в себя такие методы, как факторный анализ, кластерный анализ, дискриминантный анализ и ряд других [28, 68].

Факторный анализ, являясь в настоящее время определенным разделом математической статистики, «позволяет преобразовать некоторый набор коррелированных признаков, характеризующих изучаемое явление, в значительно меньшее число уже некоррелированных – агрегированных признаков, являющихся линейной комбинацией первоначальных признаков» [28, с.302].

В работе американского ученого Г.Хармана «Современный факторный анализ» [157] библиография содержит более 500 наименований книг и статей, отобранных автором по степени их близости к теории и вычислительным процедурам факторного анализа, что указывает на большое разнообразие методов факторного анализа и их модификаций, известных в настоящее время.

Основателем факторного анализа по праву считается Ч.Спирмэн, опубликовавший в «Американском психологическом журнале» в 1904г. статью, посвященную психологической теории «единственного генерального и некоторого числа факторов», определяющих способности и поведение людей. Именно в области психологии получил развитие этот метод анализа, когда возникла необходимость свести при обработке большое число психологических тестов к небольшому числу факторов, определяющих интеллектуальные способности индивида. Однако в последующие десятилетия этот метод нашел применение и в других отраслях знаний (в социологии, экономике, технике, метеорологии и т.д.) и признан наилучшим методом компактного представления большого массива аналитических расчетных и эмпирических данных.

В отличие от техники, где экспериментальные данные во времени могут и не изменяться, например, параметры работы оборудования (такие характеристики считаются более определенными, детерминированными), в социально-экономических исследованиях параметры «текучи». Они изменяются и во времени, и в пространстве, характеризуются таким множеством взаимосвязей и взаимообусловленностей, что представить их все в «развернутом» виде нет возможности.

Сфера применения факторного анализа может быть самой различной, но при этом главная цель одна – сжатие информации, экономное описание характеристик изучаемого явления посредством такой системы факторов, которая достаточно адекватно передает информацию, имеющуюся в наборе параметров. Осуществляется замена исходного набора параметров несколькими факторами, определяемыми «последовательно и таким образом, чтобы каждый из последующих факторов «отбирал на себя» максимум из оставшейся суммарной дисперсии параметров» [157, с.15].

В социально-экономических исследованиях объектов различной степени сложности (предприятие, отрасль, регионы) достаточно трудно установить границы по числу параметров и взаимосвязям между ними, т.к.их наблюдается такое множество в реальной жизни, что изолировать влияние отдельных переменных на поведение всей системы практически невозможно. В конечном счете можно только предполагать наличие более или менее существенной связи для ограниченного числа переменных, которые вносят наибольший вклад в вариацию признака или группы признаков, характеризующих исследуемое явление по всем наблюдаемым объектам. Использование математического аппарата при исследовании связей между признаками основывается на предположении о равновозможности различных следствий в условиях данной устойчивой связи [37].

Однако равновозможность следствий, по причине значимости «случайности» в протекании общественных процессов, очень относительна. При этом следует отметить, что исходные параметры несут большую смысловую нагрузку, являясь содержательными, количественно выраженными признаками. Поэтому, преследуя цель – сжатие информации, факторный анализ решает следующие важнейшие задачи.

Первая заключается в нахождении и интерпретации факторов, то есть система исходных параметров описывается с помощью некоторой системы факторов, значения которых распределены по объектам наблюдения. Для этого вводится в рассмотрение критерий, значение которого определяет степень качества представления данной системой факторов системы исходных параметров. Вторая задача состоит в построении матрицы факторных нагрузок, элементы которой определяют, какие исходные параметры дают основной вклад в тот или иной фактор. Задача о нахождении искомой матрицы факторных нагрузок ставится как задача нахождения экстремума выбранного критерия.

С формальной точки зрения факторный анализ – это, в первую очередь, построение нескольких критериев качества матрицы факторных нагрузок и набор алгоритмов, представляющих собой простейшие итерационные процедуры поиска экстремумов этих критериев. Чаще всего в процессе итерации обеспечивается достижение лишь локального экстремума, что, однако, достаточно эффективно для изучения внутренней структуры взаимосвязей наблюдаемых параметров.

В прикладных исследованиях с использованием факторного анализа различают поисковый и направленный подходы [52]. Поисковый подход нацелен на первоначальное исследование некоего сложного явления, на поиск гипотез о его структуре. Направленный факторный анализ осуществляется для подтверждения уже выдвинутой теоретической гипотезы путем проведения направленного эксперимента.

Значительно расширяя возможности исследователя, факторный анализ нашел применение в изучении таких экономических проблем, как ценообразование на товарных рынках, влияние инфляции на основные макроэкономические индикаторы, построение и расчет интегральных показателей, например, качества продукции, эффективности деятельности хозяйствующего субъекта, уровня жизни населения и т.п.

В региональных исследованиях методы факторного анализа используются для изучения и сопоставления районов, регионов и стран по уровню их социально-экономического развития, инвестиционной привлекательности, экологической безопасности, различного рода типологизации регионов, прогнозирования основных показателей состояния и развития крупных экономических районов.

Независимо от сферы приложения к числу конкретных задач, решение которых в настоящее время немыслимо без методов факторного анализа, можно отнести следующие [52]:

-  сжатие информации, нахождение минимального числа наиболее существенных и относительно независимых характеристик, с достаточной полнотой описывающих изучаемое явление;

-  формирование гипотезы о природе различий исследуемых объектов на основе определения факторов и их числовых значений;

-  выявление структуры взаимосвязей в группе факторов и проверка гипотезы о взаимосвязях и взаимозаменяемости признаков, сопоставление структуры нескольких наборов признаков;

-  построение разного рода интегральных показателей (уровень экономического развития, уровень жизни населения, обобщенная характеристика размера предприятия и т.д.);

-  ранжирование объектов наблюдения по определенным обобщающим показателям;

-  типологизация объектов наблюдения путем подразделения множества наблюдаемых объектов или явлений, описанных определенным набором признаков, на максимально однородные (по этим признакам) группы.

Факторный анализ за историю своего развития накопил большой арсенал методов. Широкое применение, особенно в области социально-экономических исследований, получили следующие методы: главных факторов, центроидный, метод главных компонент, каждый из которых имеет свои особенности. Однако при наличии ряда различий в способах обработки и представления информации, единство методов факторного анализа определяется общей идеей построения метода и общей терминологией.

Рассмотрим основные понятия факторного анализа на предмете данного исследования.

Регионы – субъекты РФ, представляющие собой совокупность объектов (число объектов N=78), каждый из которых характеризуется набором n=23 параметров (признаков), измеряемых количественно. Отдельный параметр будем обозначать xij (i=1,2,..78; j=1,2,..23).

Информация об объектах (регионах РФ) может быть представлена в виде двухмерной таблицы параметров xij размерностью N x n (78 х 23):

x11

x1j

x1,23

x21

x2j

x2,23

xi1

xij

xi,23

x78,1

x78,j

x78,23

Столбцы таблицы данных соответствуют признакам, характеризующим объекты и вместе составляющим профиль описания. Набор признаков – статистические показатели, представляющие в нашем случае региональные факторы, определяющие дифференциацию среднедушевых доходов. Строки матрицы – объекты – регионы РФ.

В литературе по прикладным исследованиям факторного анализа [52, 157] применяют техники – R, Q, O, P, S и T для различной организации и представления исходного материала, то есть вида матрицы данных.

Чаще всего методы факторного анализа изучают матрицы данных, в которых исследуется вариация признаков (столбцы матрицы) от объекта к объекту (строки). При этом определяются группы признаков с похожим характером вариации, составляющим основу факторов. Такой подход получил название R-техники или R-анализа. Выявленные таким образом факторы интерпретируются как обобщенные характеристики, «сгущающие» исходный набор признаков.

В геометрическом представлении объекты наблюдения – регионы – составляют пространство наблюдений, имеющих множество координат, обусловленных множеством объектов наблюдений. Измеренные по всем регионам, одинаковые наборы параметров определяют точки этого пространства (векторы). Каждое значение отдельного параметра конкретного региона является определенным значением соответствующей координаты этого параметра (рис. 3.1).

statist

Рис.3.1. Пример исходной статистики параметров по регионам

Построенную матрицу данных необходимо преобразовать, чтобы, во-первых, ослабить влияние аномальных значений признаков на результаты расчетов, компенсировать влияние возможных ошибок в первичных данных; во-вторых, устранить влияние размерности, т.к. отобранные для анализа параметры имеют разные единицы измерения. Смысл преобразования заключается в изменении характера эмпирического распределения, потому что его влияние на результаты весьма велико. Практически вся методология теории корреляции разрабатывалась применительно к предположению о нормальном характере распределения исследуемых признаков. В связи с этим необходимо изучить формы распределения каждого рассматриваемого параметра в соответствии с различными критериями согласия, что позволит обосновать правомерность применения корреляционного анализа. Для проверки нормальности распределения параметров по регионам будем использовать критерий согласия Пирсона (хи-квадрат), который из всех критериев согласия «обеспечивает наименьшую ошибку в принятии неверной гипотезы»  [28, с.371].

В социально-экономических исследованиях чаще всего встречаются распределения, характеризующиеся резким спадом частот с ростом значений признака (ряды, имеющие правую скошенность). Преобразования такого рода распределений осуществляют посредством перехода к логарифмической шкале, заменяя значения параметра хj на lgхj и уменьшая интервалы по мере роста значений хj.

Вид преобразования массива исходных данных рассматривался отдельно по каждому параметру. Для обеспечения однородности исследуемых данных были исключены аномальные наблюдения, складывающиеся под влиянием особых факторов, нехарактерных для всей совокупности объектов. Так, например, по параметру Х9 – число фермерских хозяйств в регионе – были исключены такие субъекты РФ как г.Москва и г.Санкт-Петербург ввиду отсутствия в них таковых. По параметру Х2 – доля городского населения региона – также исключались наблюдения по этим регионам из-за их особого статуса и отсутствия сельского населения. По параметру Х10 – инвестиции в основной капитал региона – из числа наблюдений исключались Тюменская область и г.Москва, т.к. значение этого параметра у данных субъектов Федерации выше на порядок относительно других регионов. 

Чтобы сделать возможным сопоставление признаков и устранить влияние размерности, матрицу исходных данных трансформируют (нормируют), вводя единый для всех признаков масштаб. Наиболее распространенный вид такой нормировки матрицы данных – приведение к стандартной форме, что предполагает переход от значений х ij   к

где xij – значение j-го признака для i-го объекта;  – среднее арифметическое значение j-го признака; sj – среднеквадратичное отклонение j-го признака (sj2 – дисперсия j-го признака).

Нормирование – последнее преобразование исходной матрицы данных, непосредственно предшествующее обработке методами факторного анализа.

Одним из основных методов факторного анализа является метод главных компонент, который был использован  применительно к предмету данного исследования. Компонентный анализ дает возможность посредством привлечения всех факторных признаков разложить корреляционную матрицу на такое же число ортогональных компонент и определить небольшое число главных из них, покрывающих большую часть колеблемости [28].

Исследуя региональный аспект в формировании среднедушевых денежных доходов населения, можно поставить следующие задачи. Во-первых, выделение из множества наблюдаемых параметров лишь тех, совокупность которых определяет в основном уровень денежных доходов населения регионов. Во-вторых, выявление признаков (параметров), которые обнаруживают наибольшую изменчивость при переходе от одного региона (объекта) к другому и тем самым характеризуют дифференциацию денежных доходов. На основе этих же данных можно решить и другую задачу: выявить группы регионов, имеющих сходный профиль по большому набору признаков, т.е. провести классификацию (типологизацию) регионов. Группировка регионов может быть осуществлена на основе результатов вышеописанного анализа признаков с использованием выявленных факторов как ее критериев.

Определяя сущность метода главных компонент, С.А Айвазян и В.С.Мхитарян в своей работе [6, с.522] приводят такой пример: «Для определения специфики фигуры человека при покупке одежды достаточно назвать значения двух признаков (размер-рост), являющихся производными от измерений ряда параметров фигуры. При этом, конечно, теряется какая-то доля информации (портной измеряет до одиннадцати параметров на клиенте), как бы огрубляются (при агрегировании) получающиеся при этом классы. Однако, как показали исследования, к вполне удовлетворительной классификации людей с точки зрения специфики их фигуры приводит система, использующая три признака, каждый из которых является некоторой комбинацией от большого числа непосредственно замеряемых на объекте параметров».

В линейное преобразование исходной системы параметров, которое приводит к главным компонентам, заложены именно эти принципиальные установки.

Предыдущая

Объявления