Как используется факторный анализ. Пример факторного анализа прибыли от продаж

Подписаться
Вступай в сообщество «shango.ru»!
ВКонтакте:

Введение в факторный анализ

В течение последних лет факторный анализ нашел свое применение среди широкого круга исследователей в основном благодаря развитию высокоскоростных компьютеров и пакетов статистических программ (например, DATATEXT, BMD, OSIRIS, SAS и SPSS). Это также коснулось большой группы пользователей, не имеющих соответствующей математической подготовки, но, тем не менее, заинтересованных в использовании потенциальных возможностей факторного анализа в своих исследованиях (Harman, 1976; Horst, 1965; Lawley и Maxswel, 1971; Mulaik, 1972).

Факторный анализ предполагает, что изучаемые переменные представляют собой линейную комбинацию некоторых скрытых (латентных) ненаблюдаемых факторов. Иными словами, существует система факторов и система изучаемых переменных. Определенная зависимость между этими двумя системами позволяет посредством факторного анализа с учетом имеющейся зависимости получать выводы по изучаемым переменным (факторам). Логическая сущность этой зависимости состоит в том, что каузальная система факторов (система независимых и зависимых переменных) всегда имеет уникальную корреляционную систему изучаемых переменных, а не наоборот. Только при жестко ограниченных условиях, налагаемых на факторный анализ, возможна недвусмысленная интерпретация каузальных структур по факторам на наличие корреляции между изучаемыми переменными. Кроме этого, существуют проблемы и другой природы. Например, при сборе эмпирических данных возможно допущение разного рода ошибок и неточностей, что в свою очередь затрудняет работу по выделению скрытых ненаблюдаемых параметров и их дальнейшего исследования.

Что же такое факторный анализ? Факторный анализ относится к множеству статистических техник, основная задача которых состоит в представлении множества изучаемых признаков в виде сокращенной системы гипотетических переменных. Факторный анализ - исследовательский эмпирический метод, который преимущественно находит свое применение в социальных и психологических дисциплинах.

В качестве примера использования факторного анализа можно рассмотреть изучение свойств личности с помощью психологических тестов. Свойства личности не поддаются прямому измерению, о них можно судить только на основании поведения человека, ответов на те или иные вопросы и т.д. Для объяснения собранных эмпирических данных их результаты подвергаются факторному анализу, который и позволяет выявить те личностные свойства, которые оказывали влияние на поведение испытуемых в проведенных опытах.

Первым этапом факторного анализа, как правило, является выбор новых признаков, которые являются линейными комбинациями прежних и «вбирают» в себя большую часть общей изменчивости наблюдаемых данных, а поэтому передают большую часть информации, заключенной в первоначальных наблюдениях. Обычно это осуществляют с помощью метода главных компонент, хотя иногда используют и другие приемы (например, метод главных факторов, метод максимального правдоподобия).

    Метод главных компонент– статистический прием, позволяющий преобразовывать исходные переменные в их линейную комбинацию (GeorgH.Dunteman). Цель метода – получить сокращенную систему исходных данных, которая намного проще для понимания и дальнейшей статистической обработки. Этот подход был предложен Пирсоном (1901) и независимо от него получил свое дальнейшее развитие у Хотеллинга (1933). Автор пытался минимизировать использование матричной алгебры при работе с данным методом.

Основная цель метода главных компонент – выделение первичных факторов и определение минимального числа общих факторов, которые удовлетворительно воспроизводят корреляции между изучаемыми переменными. Результат данного шага – матрица коэффициентов факторных нагрузок, представляющих собой в ортогональном случае коэффициенты корреляции между переменными и факторами. При определении числа выделяемых факторов используется следующий критерий: выделяются только факторы с собственными значениями больше указанной константы (как правило, единицы).

Однако обычно факторы, полученные методом главных компонент, не поддаются достаточно наглядной интерпретации. Поэтому следующим шагом факторного анализа является преобразование (вращение) факторов таким образом, чтобы облегчить их интерпретацию. Вращение факторов состоит в нахождении наиболее простой факторной структуры, то есть такого варианта оценки факторных нагрузок и остаточных дисперсий, который и дает возможность содержательно интерпретировать общие факторы и нагрузки.

    Наиболее часто исследователями в качестве метода вращения используется метод варимакс. Это метод, позволяющий, с одной стороны, за счет минимизации разброса квадратов нагрузок для каждого фактора, получить упрощенную факторную структуру за счет увеличения больших и уменьшения малых факторных нагрузок, с другой стороны.

Итак, основные цели факторного анализа:

    сокращение числа переменных (редукция данных);

    определение структуры взаимосвязей между переменными, т.е. классификация переменных .

Поэтому факторный анализ используется или как метод сокращения данных или как метод классификации.

Практические примеры и советы по применению факторного анализа можно, найти в книге Стивенса (Stevens, 1986); более подробное описание приводят Кули и Лонес (Cooley, Lohnes, 1971); Харман (Harman, 1976); Ким и Мюллер (Kim, Mueller, 1978a, 1978b); Лоули и Максвелл (Lawley, Maxwell, 1971); Линдеман, Меренда и Голд (Lindeman, Merenda, Gold, 1980); Моррисон (Morrison, 1967) и Мулэйк (Mulaik, 1972). Интерпретация вторичных факторов в иерархическом факторном анализе, как альтернатива традиционному вращению факторов, дана Верри (Wherry, 1984).

Вопросы подготовки данных для применения

факторного анализа

Рассмотрим ряд вопросов и кратких ответов в рамках использования факторного анализа.

    Какой уровень измерений требует факторный анализ или, иными словами, в каких шкалах измерений должны представляться данные для факторного анализа?

Факторный анализ требует, чтобы переменные были представлены в интервальной шкале (Stevens, 1946) и отвечали нормальному распределению. Это требование предполагает также, что в качестве входных данных используются ковариационные или корреляционные матрицы.

    Должен ли исследователь избегать использования факторного анализа, когда метрическая основа переменных определена неточно, т.е. данные представлены в порядковой шкале?

Нет необходимости. Многие переменные, представляющие, например, измерения мнений испытуемых по большому количеству тестов, не имеют точно установленной метрической базы. Однако, в общем, предполагается, что многие «порядковые переменные» могут содержать числовые значения, не искажающие и даже сохраняющие основные свойства изучаемого признака. Задачи исследователя: а) правильно определить число рефлексивно выделяемых порядков (уровней); б) учесть, что сумма допущенных искажений будет включена в корреляционную матрицу, являющуюся основой входных данных факторного анализа; в) коэффициенты корреляции закрепляются в качестве «порядковых» искажений в измерениях (Labovitz, 1967, 1970;Kim, 1975).

Долгое время считалось, что искажения назначаются числовым значениям именно порядковых категорий. Однако это необоснованно, поскольку и для метрических величин возможны искажения, пусть даже минимальные, в процессе проведения эксперимента. В факторном анализе результаты зависят от возможного допущения ошибок, получаемых в процессе измерения, а не их происхождения и соотнесения к данным определенного типа шкал.

    Можно ли использовать факторный анализ для номинальных (дихотомических) переменных?

Многие исследователи утверждают, что использовать факторный анализ для номинальных переменных очень удобно. Во-первых, дихотомические значения (значения, равные «0» и «1») исключают выбор каких-либо иных, отличных от них. Во-вторых, как результат, коэффициент связи является эквивалентом коэффициента корреляции Пирсона, который и выступает в качестве числового значения переменной для факторного анализа.

Однако однозначно положительного ответа на данный вопрос нет. Дихотомические переменные сложно выразить в рамках аналитической факторной модели: каждая переменная имеет значение весовой нагрузки, по крайней мере, двух основных факторов - общего и частного (Kim,Muller). Даже если эти факторы имеют два значения (что довольно редко встречается в реальных факторных моделях), то итоговые результаты в наблюдаемых переменных должны содержать, как минимум, четыре различных значения, которые, в свою очередь, и оправдывают противоречивость использования номинальных переменных. Поэтому факторный анализ для таких переменных используется с целью получения ряда эвристических критериев.

    Сколько должно быть переменных для каждого гипотетически построенного фактора?

Предполагается, что для каждого фактора должно быть, по крайней мере, три переменные. Но это требование опускается, если факторный анализ используется для подтверждения какой-либо гипотезы. В общем, исследователи едины в том, что необходимо иметь, по крайней мере, вдвое больше переменных, чем факторов.

Еще один момент касательно данного вопроса. Чем больше размер выборки, тем достовернее значение критерия ХИ -квадрат. Результаты считаются статистически значимыми, если выборка включает как минимум 51 наблюдение. Таким образом:

N-n-150,(3.33)

где N – размер выборки (число измерений),

n – количество переменных (Lawley, Maxwell, 1971).

Это, конечно, только общее правило.

    Какой смысл имеет знак факторной нагрузки?

Сам знак не имеет существенного значения и не существует пути для оценки значимости связи между переменной и фактором. Однако знаки переменных, входящих в фактор, имеют специфическое значение относительно знаков других переменных. Различные знаки просто означают, что переменные связаны с фактором в противоположных направлениях.

Например, по результатам факторного анализа было получено, что для пары качеств открытый-замкнутый (многофакторный опросник Кетелла) имеют место соответственно положительная и отрицательная весовые нагрузки. Тогда говорят, что доля качестваоткрытый, в выделенном факторе больше, чем доля качествазамкнутый.

Главные компоненты и факторный анализ

    Факторный анализ как метод редукции данных

Предположим, что проводится (до некоторой степени "глупое") исследование, в котором измеряется рост ста людей в метрах и сантиметрах. Таким образом, имеются две переменные. Если далее исследовать, например, влияние разных пищевых добавок на рост, будет ли целесообразным использовать обе переменные? Вероятно, нет, т.к. рост является одной характеристикой человека, независимо от того, в каких единицах он измеряется.

Предположим, что измеряется удовлетворенность людей жизнью с помощью опросника, содержащего различные пункты. Задаются, например, вопросы: удовлетворены ли люди своим хобби (пункт 1) и как интенсивно они им занимаются (пункт 2). Результаты преобразуются так, что средние по уровню ответы (например, для удовлетворенности) соответствуют значению 100, в то время как ниже и выше средних ответов расположены меньшие и большие значения, соответственно. Две переменные (ответы на два разных пункта) коррелированы между собой. Из высокой коррелированности двух этих переменных можно сделать вывод об избыточности двух пунктов опросника. Это, в свою очередь, позволяет осуществить объединение двух переменных в один фактор.

Новая переменная (фактор) будет включать в себя наиболее существенные черты обеих переменных. Итак, фактически, выполнено сокращение исходного числа переменных и осуществлена замена двух переменных одной. Отметим, что новый фактор (переменная) в действительности является линейной комбинацией двух исходных переменных.

Пример, в котором две коррелированные переменные объединены в один фактор, показывает главную идею факторного анализа или, более точно, анализа главных компонент. Если же пример с двумя переменными распространить на большее число переменных, то вычисления становятся сложнее, однако основной принцип представления двух или более зависимых переменных одним фактором остается в силе.

    Метод главных компонент

Анализ главных компонент является методом сокращения или редукции данных, т.е. методом сокращения числа переменных. Возникает естественный вопрос: сколько факторов следует выделять? Отметим, что в процессе последовательного выделения факторов они включают в себя все меньше и меньше изменчивости. Решение о том, когда следует остановить процедуру выделения факторов, главным образом зависит от точки зрения на то, что считать малой "случайной" изменчивостью. Это решение достаточно произвольно, однако имеются некоторые рекомендации, позволяющие рационально выбрать число факторов (см. раздел Собственные значения и число выделяемых факторов ).

В случае, когда имеются более двух переменных, можно считать, что они определяют трехмерное "пространство" точно так же, как две переменные определяют плоскость. Если имеется три переменные, то можно построить трехмерную диаграмму рассеяния (см. рис. 3.10).

Рис. 3.10. Трехмерная диаграмма рассеяния признака

Для случая более трех переменных, становится невозможным представить точки на диаграмме рассеяния, однако логика вращения осей с целью максимизации дисперсии нового фактора остается прежней.

После того, как найдена линия, для которой дисперсия максимальна, вокруг нее остается некоторый разброс данных и процедуру естественно повторить. В анализе главных компонент именно так и делается: после того, как первый фактор выделен , то есть, после того, как первая линия проведена, определяется следующая линия, максимизирующая остаточную вариацию (разброс данных вокруг первой прямой), и т.д. Таким образом, факторы последовательно выделяются один за другим. Так как каждый последующий фактор определяется так, чтобы максимизировать изменчивость, оставшуюся от предыдущих, то факторы оказываются независимыми друг от друга (некоррелированными или ортогональными ).

    Собственные значения и число выделяемых факторов

Рассмотрим некоторые стандартные результаты анализа главных компонент. При повторных вычислениях выделяются факторы с все меньшей и меньшей дисперсией. Для простоты изложения считают, что обычно работа начинается с матрицы, в которой дисперсии всех переменных равны 1,0. Поэтому общая дисперсия равна числу переменных. Например, если имеется 10 переменных и дисперсия каждой из них равна 1, то наибольшая изменчивость, которая потенциально может быть выделена, равна 10 раз по 1.

Предположим, что при изучении степени удовлетворенности жизнью включено 10 пунктов для измерения различных аспектов удовлетворенности домашней жизнью и работой. Дисперсия, объясненная последовательными факторами, представлена в таблице 3.14:

Таблица 3. 14

Таблица собственных значений

STATISTICA ФАКТОРНЫЙ АНАЛИЗ

Собственные значения (factor.sta) Выделение: Главные компоненты

Значение

Собственные значения

% общей дисперсии

Кумулят. собств. знач.

Кумулят. %

Во втором столбце таблицы 3. 14. (Собственные значения) представлена дисперсия нового, только что выделенного фактора. В третьем столбце для каждого фактора приводится процент от общей дисперсии (в данном примере она равна 10) для каждого фактора. Как видно, первый фактор (значение 1) объясняет 61 процент общей дисперсии, фактор 2 (значение 2) – 18 процентов, и т.д. Четвертый столбец содержит накопленную (кумулятивную) дисперсию.

Итак, дисперсии, выделяемые факторами, названы собственными значениями . Это название происходит из использованного способа вычисления.

Как только получена информация о том, сколько дисперсии выделил каждый фактор, можно возвратиться к вопросу о том, сколько факторов следует оставить. Как говорилось выше, по своей природе это решение произвольно. Однако имеются некоторые общеупотребительные рекомендации, и на практике следование им дает наилучшие результаты.

Критерии выделения факторов

    Критерий Кайзера. Сначала отбираются только те факторы, собственные значения которых больше 1. По существу, это означает, что если фактор не выделяет дисперсию, эквивалентную, по крайней мере, дисперсии одной переменной, то он опускается. Этот критерий предложен Кайзером (Kaiser, 1960), и является наиболее широко используемым. В приведенном выше примере (см. табл. 3.14) на основе этого критерия следует сохранить только 2 фактора (две главные компоненты).

    Критерий каменистой осыпи является графическим методом, впервые предложенным Кэттелем (Cattell, 1966). Он позволяет изобразить собственные значения в виде простого графика:

Рис. 3. 11. Критерий каменистой осыпи

Оба критерия были изучены подробно Брауном (Browne, 1968), Кэттелем и Джасперсом (Cattell, Jaspers, 1967), Хакстианом, Рожерсом и Кэттелем (Hakstian, Rogers, Cattell, 1982), Линном (Linn, 1968), Тюкером, Купманом и Линном (Tucker, Koopman, Linn, 1969). Кэттель предложил найти такое место на графике, где убывание собственных значений слева направо максимально замедляется. Предполагается, что справа от этой точки находится только «факториальная осыпь» («осыпь» – геологический термин, обозначающий обломки горных пород, скапливающиеся в нижней части скалистого склона). В соответствии с этим критерием можно оставить в рассмотренном примере 2 или 3 фактора.

Какому критерию все-таки следует отдавать предпочтение на практике?Теоретически, можно вычислить характеристики путем генерации случайных данных для конкретного числа факторов. Тогда можно увидеть, обнаружено с помощью используемого критерия достаточно точное число существенных факторов или нет. С использованием этого общего метода первый критерий (критерий Кайзера ) иногда сохраняет слишком много факторов, в то время как второй критерий (критерий каменистой осыпи ) иногда сохраняет слишком мало факторов; однако оба критерия вполне хороши при нормальных условиях, когда имеется относительно небольшое число факторов и много переменных.

На практике возникает важный дополнительный вопрос, а именно: когда полученное решение может быть содержательно интерпретировано. Поэтому обычно исследуется несколько решений с большим или меньшим числом факторов, и затем выбирается одно наиболее "осмысленное". Этот вопрос далее будет рассматриваться в рамках вращений факторов.

    Общности

На языке факторного анализа доля дисперсии отдельной переменной, принадлежащая общим факторам (и разделяемая с другими переменными) называется общностью . Поэтому дополнительной работой, стоящей перед исследователем при применении этой модели, является оценка общностей для каждой переменной, т.е. доли дисперсии, которая является общей для всех пунктов. Тогда доля дисперсии , за которую отвечает каждый пункт, равна суммарной дисперсии, соответствующей всем переменным, минус общность (Harman, Jones, 1966).

    Главные факторы и главные компоненты

Термин факторный анализ включает как анализ главных компонент, так и анализ главных факторов. Предполагается, что, в целом, известно сколько факторов следует выделить. Можно узнать (1) значимость факторов, (2) можно ли интерпретировать их разумным образом и (3) как это сделать. Чтобы проиллюстрировать, каким образом это может быть сделано, производятся действия "в обратном порядке", то есть, начинают с некоторой осмысленной структуры, а затем смотрят, как она отражается на результатах.

Основное различие двух моделей факторного анализа состоит в том, что в анализе главных компонент предполагается, что должна быть использована вся изменчивость переменных, тогда как в анализе главных факторов используется только изменчивость переменной, общая и для других переменных.

В большинстве случаев эти два метода приводят к весьма близким результатам. Однако анализ главных компонент часто более предпочтителен как метод сокращения данных, в то время как анализ главных факторов лучше применять с целью определения структуры данных.

Факторный анализ как метод классификации данных

    Корреляционная матрица

Первый этап факторного анализа предусматривает вычисление корреляционной матрицы (в случае нормального выборочного распределения). Вернемся к примеру об удовлетворенности и рассмотрим корреляционную матрицу для переменных, относящихся к удовлетворенности на работе и дома.

Для того, чтобы выяснить, насколько прибыльным или убыточным является предприятие, недостаточно просто считать деньги. Чтобы понять это наверняка, а главное, способствовать увеличению прибыли, нужно регулярно проводить и в целом работы предприятия. А для этого нужно обладать некоторыми умениями в бухгалтерской сфере и определенными сведениями. Стоит учесть, что фирма работала и в момент инфляции, и во время кризиса. Цены менялись постоянно. Теперь понимаете, почему банальный подсчет денег не дает возможности объективно оценить ситуацию с прибылью или затратами? Ведь нужно учитывать и ценовой фактор.

Итак, многие затрудняются сделать Пример нашего анализа, надеемся, поможет им сделать свой - по аналогии данный вид диагностики составляется крайне быстро. Оформляется он в форме таблицы. Для начала сделаем шапку нашего факторного анализа. Чертим таблицу в 5 столбцов и 9 строк. Первый столбец делайте шире - в нем будут названия статей предприятия, а не цифры. Он будет называться - "Показатели", что вы и должны записать в первой строке столбца. В нем заполняете все строки соответственно образцу: 1 - название, 2 - ставите цифру 1 - нумерация столбцов, в 3 строке запишите - "Выручка с продаж", 4 - "Себестоимость". В пятую строку первого столбца поставьте пункт - "Коммерческие расходы". В 6 напишите - "Расходы на управление процессом". Седьмая строчка называется - а 8 - "Индекс изменения цен", и последняя, 9 строчка - "Продажа в сопоставимых ценах".

Далее переходим к оформлению 2 столбца: в 1 строке пишем - "Предыдущий период, тыс.руб." (можете написать и другие денежные единицы - евро, доллар и т.д. - зависит от того, в какой валюте вы будете проводить вычисления), а во второй строке пишем цифру - 2. Переходим к 3 столбцу - в нем 1 строка имеет название - "Отчетный период", тыс. руб. А вторая заполняется цифрой 3. Далее оформляем наш факторный анализ выручки и переходим к столбцу 4. В первую строку вписываем - "Абсолютное изменение, тыс.руб.", а во второй строке содержится небольшая формула: 4=3-2. Это значит, что показатели, которые вы будете писать в последующих строках, будут результатом вычитания показателей второго столбца из показателей третьего. Переходим к оформлению последнего - 5 столбца. В нем в 1 строке нужно написать: "Относительные изменения%", что означает, что в этом столбце все данные будут записаны в процентном соотношении. Во второй строке формула: 5=(4/2)*100%. Все, шапку мы оформили, осталось только заполнить каждый пункт таблицы соответствующими данными. Проводим факторный анализ, пример которого мы вам даем. Первым делом вычисляем индекс изменения цен - это едва ли не самая важная цифра в наших рассчетах. Записываем цифры разных периодов в соответствующие столбцы. В 4 и 5 столбиках проводим необходимые вычисления. Факторный анализ, пример которого вы сможете просмотреть, предполагает точность в цифрах. Поэтому писать в 3 строки каждого столбика нужно только достоверную информацию. В 4 и 5 опять же проводим вычисления. Как вы понимаете, факторный главным образом осуществляется в строках 5 и 6: постарайтесь дописать туда максимально реальные, не заниженные, цифры. В 4 и 5 столбике этих строк снова проводите вычисления по формулам. Далее осуществляем факторный анализ выручки в столбце 7 - прибыль. Записываем достоверные цифры во 2 и 3 столбик, а в 4 и 5 снова считаем все по формулам. И остается последний столбец: пишем данные, вычисляем. Итог: факторный анализ, пример которого мы вам даем, показывает, каково влияние каждого из факторов, описанных в статьях, на прибыль или затраты производства. Теперь вы видите слабые места и сможете исправить ситуацию, чтобы получать как можно большую прибыль.

Вы сделали все вычисления, чтобы провести факторный анализ, однако они не помогут вам ничем, если вы не проанализируете полученные данные досконально.

Гальтоном Ф. (1822-1911), внесшим также большой вклад в исследование индивидуальных различий. Но в разработку Факторного анализа внесли вклад многие ученые. Разработкой и внедрением факторного анализа в психологию занимались такие ученые как Спирмен Ч. (1904, 1927, 1946), Терстоун Л. (1935, 1947, 1951) и Кеттел Р. (1946, 1947, 1951). Также нельзя не упомянуть английского математика и философа Пирсона К., в значительной степени развившего идеи Ф. Гальтона, американского математика Хотеллинга Г. , разработавшего современный вариант метода главных компонент . Внимания заслуживает и английский психолог Айзенк Г. , широко использовавший Факторный анализ для разработки психологической теории личности. Математически факторный анализ разрабатывался Хотеллингом, Харманом, Кайзером, Терстоуном, Такером и др. Сегодня факторный анализ включён во все пакеты статистической обработки данных - , SAS , SPSS , Statistica и т. д.

Задачи и возможности факторного анализа

Факторный анализ позволяет решить две важные проблемы исследователя: описать объект измерения всесторонне и в то же время компактно . С помощью факторного анализа возможно выявление скрытых переменных факторов, отвечающих за наличие линейных статистических связей корреляций между наблюдаемыми переменными.

Таким образом можно выделить 2 цели Факторного анализа:

При анализе в один фактор объединяются сильно коррелирующие между собой переменные, как следствие происходит перераспределение дисперсии между компонентами и получается максимально простая и наглядная структура факторов. После объединения коррелированность компонент внутри каждого фактора между собой будет выше, чем их коррелированность с компонентами из других факторов. Эта процедура также позволяет выделить латентные переменные, что бывает особенно важно при анализе социальных представлений и ценностей. Например, анализируя оценки, полученные по нескольким шкалам, исследователь замечает, что они сходны между собой и имеют высокий коэффициент корреляции, он может предположить, что существует некоторая латентная переменная, с помощью которой можно объяснить наблюдаемое сходство полученных оценок. Такую латентную переменную называют фактором . Данный фактор влияет на многочисленные показатели других переменных, что приводит нас к возможности и необходимости выделить его как наиболее общий, более высокого порядка. Для выявления наиболее значимых факторов и, как следствие, факторной структуры, наиболее оправданно применять метод главных компонентов (МГК). Суть данного метода состоит в замене коррелированных компонентов некоррелированными факторами. Другой важной характеристикой метода является возможность ограничиться наиболее информативными главными компонентами и исключить остальные из анализа, что упрощает интерпретацию результатов. Достоинство МГК также в том, что он - единственный математически обоснованный метод факторного анализа .

Факторный анализ может быть:

  • разведочным - он осуществляется при исследовании скрытой факторной структуры без предположения о числе факторов и их нагрузках;
  • конфирматорным , предназначенным для проверки гипотез о числе факторов и их нагрузках (примечание 2).

Условия применения факторного анализа

Практическое выполнение факторного анализа начинается с проверки его условий. В обязательные условия факторного анализа входят:

Основные понятия факторного анализа

  • Фактор - скрытая переменная
  • Нагрузка - корреляция между исходной переменной и фактором

Процедура вращения. Выделение и интерпретация факторов

Сущностью факторного анализа является процедура вращения факторов, то есть перераспределения дисперсии по определённому методу. Цель ортогональных вращений - определение простой структуры факторных нагрузок, целью большинства косоугольных вращений является определение простой структуры вторичных факторов, то есть косоугольное вращение следует использовать в частных случаях. Поэтому ортогональное вращение предпочтительнее. Согласно определению Мюльека простая структура соответствует требованиям:

  • в каждой строке матрицы вторичной структуры V должен быть хотя бы один нулевой элемент;
  • Для каждого столбца k матрицы вторичной структуры V должно существовать подмножество из r линейно-независимых наблюдаемых переменных, корреляции которых с k-м вторичным фактором - нулевые. Данный критерий сводится к тому, что каждый столбец матрицы должен содержать не менее r нулей.
  • У одного из столбцов каждой пары столбцов матрицы V должно быть несколько нулевых коэффициентов (нагрузок) в тех позициях, где для другого столбца они ненулевые. Это предположение гарантирует различимость вторичных осей и соответствующих им подпространств размерности r-1 в пространстве общих факторов.
  • При числе общих факторов больше четырех в каждой паре столбцов должно быть некоторое количество нулевых нагрузок в одних и тех же строках. Данное предположение дает возможность разделить наблюдаемые переменные на отдельные скопления.
  • Для каждой пары столбцов матрицы V должно быть как можно меньше значительных по величине нагрузок, соответствующих одним и тем же строкам. Это требование обеспечивает минимизацию сложности переменных.

(В определении Мьюлейка через r обозначено число общих факторов, а V - матрица вторичной структуры, образованная координатами (нагрузками) вторичных факторов, получаемых в результате вращения.) Вращение бывает:

  • ортогональным
  • косоугольным .

При первом виде вращения каждый последующий фактор определяется так, чтобы максимизировать изменчивость, оставшуюся от предыдущих, поэтому факторы оказываются независимыми, некоррелированными друг от друга (к этому типу относится МГК). Второй вид - это преобразование, при котором факторы коррелируют друг с другом. Преимущество косоугольного вращения состоит в следующем: когда в результате его выполнения получаются ортогональные факторы, можно быть уверенным, что эта ортогональность действительно им свойственна, а не привнесена искусственно. Существует около 13 методов вращения в обоих видах, в статистической программе SPSS 10 доступны пять: три ортогональных, один косоугольный и один комбинированный, однако из всех наиболее употребителен ортогональный метод «варимакс ». Метод «варимакс» максимизирует разброс квадратов нагрузок для каждого фактора, что приводит к увеличению больших и уменьшению малых значений факторных нагрузок. В результате простая структура получается для каждого фактора в отдельности .

Главной проблемой факторного анализа является выделение и интерпретация главных факторов. При отборе компонент исследователь обычно сталкивается с существенными трудностями, так как не существует однозначного критерия выделения факторов, и потому здесь неизбежен субъективизм интерпретаций результатов. Существует несколько часто употребляемых критериев определения числа факторов. Некоторые из них являются альтернативными по отношению к другим, а часть этих критериев можно использовать вместе, чтобы один дополнял другой:

Практика показывает, что если вращение не произвело существенных изменений в структуре факторного пространства, это свидетельствует о его устойчивости и стабильности данных. Возможны ещё два варианта: 1). сильное перераспределение дисперсии - результат выявления латентного фактора; 2). очень незначительное изменение (десятые, сотые или тысячные доли нагрузки) или его отсутствие вообще, при этом сильные корреляции может иметь только один фактор, - однофакторное распределение. Последнее возможно, например, когда на предмет наличия определённого свойства проверяются несколько социальных групп, однако искомое свойство есть только у одной из них.

Факторы имеют две характеристики: объём объясняемой дисперсии и нагрузки. Если рассматривать их с точки зрения геометрической аналогии, то касательно первой отметим, что фактор, лежащий вдоль оси ОХ, может максимально объяснять 70 % дисперсии (первый главный фактор), фактор, лежащий вдоль оси ОУ, способен детерминировать не более 30 % (второй главный фактор). То есть в идеальной ситуации вся дисперсия может быть объяснена двумя главными факторами с указанными долями . В обычной ситуации может наблюдаться два или более главных факторов, а также остаётся часть неинтерпретируемой дисперсии (геометрические искажения), исключаемая из анализа по причине незначимости. Нагрузки, опять же с точки зрения геометрии, есть проекции от точек на оси ОХ и ОУ (при трёх- и более факторной структуре также на ось ОZ). Проекции - это коэффициенты корреляции, точки - наблюдения, таким образом, факторные нагрузки являются мерами связи. Так как сильной считается корреляция с коэффициентом Пирсона R ≥ 0,7, то в нагрузках нужно уделять внимание только сильным связям. Факторные нагрузки могут обладать свойством биполярности - наличием положительных и отрицательных показателей в одном факторе. Если биполярность присутствует, то показатели, входящие в состав фактора, дихотомичны и находятся в противоположных координатах .

Методы факторного анализа:

Примечания

Литература

  • Афифи А., Эйзен С. Статистический анализ: Подход с использованием ЭВМ. - М .: Мир, 1982. - С. 488.
  • Колин Купер. Индивидуальные различия. - М.: Аспект Пресс, 2000. - 527 с.
  • Гусев А. Н., Измайлов Ч. А., Михалевская М. Б. Измерение в психологии. - М.: Смысл, 1997. - 287 с.
  • Митина О. В., Михайловская И. Б. Факторный анализ для психологов. - М.: Учебно-методический коллектор Психология, 2001. - 169 с.
  • Факторный, дискриминантный и кластерный анализ / сборник работ под ред. Енюкова И. С. - М.: Финансы и статистика, 1989. - 215 с.
  • Пациорковский В. В., Пациорковская В. В. SPSS для социологов. - М.: Учебное пособие ИСЭПН РАН, 2005. - 433 с.
  • Бююль А., Цёфель П. SPSS: Искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. - СПб.: ООО «ДиаСофтЮП», 2002. - 603 с.
  • Факторный, дискриминантныи и кластерный анализ: Пер.

Ф18 с англ./Дж.-О. Ким, Ч. У. Мьюллер, У. Р. Клекка и др.; Под ред. И. С. Енюкова. - М.: Финансы и статистика, 1989.- 215 с:

Ссылки

  • Электронный учебник StatSoft. Главные компоненты и факторный анализ
  • Нелинейный метод главных компонент (сайт-библиотека)

Wikimedia Foundation . 2010 .

Смотреть что такое "Факторный анализ" в других словарях:

    факторный анализ - — факторный анализ Область математической статистики (один из разделов многомерного статистического анализа), объединяющая вычислительные методы, которые в ряде случаев позволяют … Справочник технического переводчика

    Статистический метод проверки гипотез о влиянии разл. факторов на изучаемую случайную величину. Разработана и общепринята модель, при которой влияние фактора представлено в линейном виде. Процедура анализа сводится к оценочным операциям с помощью … Геологическая энциклопедия

    факторный анализ - (от лат. factor действующий, производящий и греч. analysis разложение, расчленение) метод многомерной математической статистики (см. статистические методы в психологии), применяемый при исследовании статистически связанных признаков с целью… … Большая психологическая энциклопедия

    Метод исследования экономики и производства, в основе которого лежит анализ воздействия разнообразных факторов на результаты экономической деятельности, ее эффективность. Райзберг Б.А., Лозовский Л.Ш., Стародубцева Е.Б.. Современный экономический … Экономический словарь

    Факторный анализ - область математической статистики (один из разделов многомерного статистического анализа), объединяющая вычислительные методы, которые в ряде случаев позволяют получить компактное описание исследуемых явлений на основе… … Экономико-математический словарь

    ФАКТОРНЫЙ АНАЛИЗ, в статистике и психометрии математический метод, при помощи которого большое количество измерений и исследований сводится к малому числу «факторов», полностью объясняющих полученные результаты исследований, а также их… … Научно-технический энциклопедический словарь

    Раздел статистического анализа многомерного (См. Статистический анализ многомерный),. объединяющий методы оценки размерности множества наблюдаемых переменных посредством исследования структуры ковариационных или корреляционных матриц.… … Большая советская энциклопедия

Называют факторным анализом . Основными разновидностями факторного анализа являются детерминированный анализ и стохастический анализ.

Детерминированный факторный анализ основывается на методике изучения влияния таких факторов, взаимосвязь которых с обобщающим экономическим показателем является функциональной. Последнее означает, что обобщающий показатель представляет собой либо произведение, либо частное от деления, либо алгебраическую сумму отдельных факторов.

Стохастический факторный анализ основывается на методике исследования влияния таких факторов, взаимосвязь которых с обобщающим экономическим показателем является вероятностной, иначе — корреляционной.

В условиях наличия функциональной взаимосвязи с изменением аргумента всегда имеет место и соответствующе изменение функции. При наличии же вероятностной взаимосвязи изменение аргумента может сочетаться с несколькими значениями изменения функции.

Факторный анализ подразделяется также на прямой , иначе дедуктивный анализ и обратный (индуктивный) анализ.

Первый вид анализа осуществляет изучение влияния факторов дедуктивным методом, то есть в направлении от общего к частному. При обратном факторном анализе влияние факторов исследуется индуктивным методом — в направлении от частных факторов к обобщающим экономическим показателям.

Классификация факторов, влияющих на эффективности деятельности организации

Факторы, влияние которых изучается при проведении , классифицируются по различным признакам. Прежде всего их можно подразделить на два основных вида: внутренние факторы , зависящие от деятельности данной , и внешние факторы , не зависящие от данной организации.

Внутренние факторы в зависимости от величины их воздействия на , можно подразделить на главные и второстепенные. К числу главных относятся факторы, связанные с использованием , и материалов, а также факторы, обусловленные снабженческо-сбытовой деятельностью и некоторыми другими сторонами функционирования организации. Главные факторы оказывают основополагающее воздействие на обобщающие экономические показатели. Внешние факторы, не зависящие от данной организации, обусловлены природно-климатическими (географическими), социально-экономическими, а также внешнеэкономическими условиями.

В зависимости от длительности их воздействия на экономические показатели можно выделить постоянные и переменные факторы . Первый вид факторов оказывает влияние на экономические показатели, которое не ограничено во времени. Переменные факторы воздействуют на экономические показатели лишь в течение определенного периода времени.

Факторы могут подразделяться на экстенсивные (количественные) и интенсивные (качественные) по признаку сущности их влияния на экономические показатели. Так, например, если изучается влияние на объем выпуска продукции трудовых факторов, то изменение численности рабочих будет являться экстенсивным фактором, а изменение производительности труда одного рабочего — интенсивным факторов.

Факторы, влияющие на экономические показатели, по степени их зависимости от воли и сознания работников организации и других лиц, могут подразделяться на объективные и субъективные факторы . К объективными факторам могут быть отнесены погодные условия, стихийные бедствия, которые не зависят от деятельности человека. Субъективные же факторы целиком и полностью зависят от людей. Подавляющее большинство факторов следует отнести к числу субъективных.

Факторы можно подразделить также в зависимости от сферы их действия на факторы неограниченного и факторы ограниченного действия. Первый вид факторов действует повсеместно, в любых отраслях народного хозяйства. Второй вид факторов оказывает влияние лишь внутри какой-либо отрасли или даже отдельной организации.

По своей структуре факторы подразделяются на простые и сложные. Подавляющая часть факторов — сложные, включающие в себя несколько составных частей. Вместе с тем имеются и такие факторы, которые не поддаются расчленению. Например, фондоотдача может служить примером сложного фактора. Количество дней, отработанных оборудованием за данный период является простым фактором.

По характеру влияния на обобщающие экономические показатели различают прямые и косвенные факторы . Так, изменение проданной продукции, хотя оно и оказывает обратное влияние на величину прибыли, следует считать прямым факторам, то есть фактором первого порядка. Изменение же величины материальных затрат оказывает на прибыль косвенное влияние, т.е. воздействует на прибыль не непосредственно, а через себестоимость, представляющую собой фактор первого порядка. Исходя из этого уровень материальных затрат следует считать фактором второго порядка, то есть косвенным фактором.

В зависимости от того, можно ли дать количественную оценку влияния данного фактора на обобщающий экономический показатель, различают измеряемые и неизмеряемые факторы.

Эта классификация тесно взаимосвязана с классификацией резервов повышения эффективности хозяйственной деятельности организаций, или, иначе говоря, резервов улучшения анализируемых экономических показателей.

Факторный экономический анализ

В те признаки, которые характеризуют причину, носят название факторных, независимых. Те же признаки, которые, характеризуют следствие, принято называть результатными, зависимыми.

Совокупность факторных и результативных признаков, которые находятся в одной причинно-следственной связи, носит название факторной системы . Существует также понятие модели факторной системы. Она характеризует взаимосвязь между результативным признаком, обозначаемым как y, и факторными признаками, обозначаемыми как . Иными словами, модель факторной системы выражает взаимосвязь между обобщающим экономическим показателям и отдельными факторами, влияющими на этот показатель. При этом в качестве факторов выступают другие экономические показатели, представляющие собой причины изменения обобщающего показателя.

Модель факторной системы математически может быть выражена при помощи следующей формулы:

Установление зависимостей между обобщающими (результативными) и влияющими на них факторами носит название экономико-математического моделирования.

В изучается два вида взаимосвязей между обобщающими показателями и влияющими на них факторами:

  • функциональная (иначе — функционально-детерминированная, или жестко детерминированная связь.)
  • стохастическая (вероятностная) связь.

Функциональная связь — это такая связь, при которой каждому значению фактора (факторного признака) соответствует вполне определенное неслучайное значение обобщающего показателя (результативного признака).

Стохастическая связь — это такая связь, при которой каждому значению фактора (факторного признака) соответствует множество значений обобщающего показателя (результативного признака). В этих условиях для каждого значения фактора x значения обобщающего показателя y образуют условное статистическое распределение. Вследствие этого изменение значения фактора x только в среднем вызывает изменение обобщающего показателя y.

В соответствии с двумя рассмотренными типами взаимосвязей различают методы детерминированного факторного анализа и методы стохастического факторного анализа. Рассмотрим следующую схему:

Методы, применяемые в факторном анализе. Схема №2

Наибольшую полноту и глубину аналитического исследования, наибольшую точность результатов анализа обеспечивает применение экономико-математических методов исследования.

Эти методы имеют ряд преимуществ перед традиционными и статистическими методами анализа.

Так, они обеспечивают более точное и детальное исчисление влияния отдельных факторов на изменение величин экономических показателей а также дают возможность решения ряда аналитических задач, которые не могут быть сделаны без применения экономико-математических методов.

Все явления и процессы хозяйственной деятельности предприятий находятся во взаимосвязи и взаимообусловленности. Одни из них непосредственно связаны между собой, другие косвенно. Отсюда важным методологическим вопросом в экономическом анализе является изучение и измерение влияния факторов на величину исследуемых экономических показателей.

Под экономическим факторным анализом понимается постепенный переход от исходной факторной системы к конечной факторной системе, раскрытие полного набора прямых, количественно измеримых факторов, оказывающих влияние на изменение результативного показателя.

По характеру взаимосвязи между показателями различают методы детерминированного и стохастического факторного анализа.

Детерминированный факторный анализ представляет собой методику исследования влияния факторов, связь которых с результативным показателем носит функциональный характер.

Основные свойства детерминированного подхода к анализу:
· построение детерминированной модели путем логического анализа;
· наличие полной (жесткой) связи между показателями;
· невозможность разделения результатов влияния одновременно действующих факторов, которые не поддаются объединению в одной модели;
· изучение взаимосвязей в краткосрочном периоде.

Различают четыре типа детерминированных моделей:

Аддитивные модели представляют собой алгебраическую сумму показателей и имеют вид

К таким моделям, например, относятся показатели себестоимости во взаимосвязи с элементами затрат на производство и со статьями затрат; показатель объема производства продукции в его взаимосвязи с объемом выпуска отдельных изделий или объема выпуска в отдельных подразделениях.

Мультипликативные модели в обобщенном виде могут быть представлены формулой

.

Примером мультипликативной модели является двухфакторная модель объема реализации

,

где Ч - среднесписочная численность работников;

CB - средняя выработка на одного работника.

Кратные модели:

Примером кратной модели служит показатель срока оборачиваемости товаров (в днях) . Т ОБ.Т :

,

где З Т - средний запас товаров; О Р - однодневный объем реализации.

Смешанные модели представляют собой комбинацию перечисленных выше моделей и могут быть описаны с помощью специальных выражений:

Примерами таких моделей служат показатели затрат на 1 руб. товарной продукции, показатели рентабельности и др.

Для изучения зависимости между показателями и количественного измерения множества факторов, повлиявших на результативный показатель, приведем общие правила преобразования моделей с целью включения новых факторных показателей.

Для детализации обобщающего факторного показателя на его составляющие, которые представляют интерес для аналитических расчетов, используют прием удлинения факторной системы.

Если исходная факторная модель , а , то модель примет вид .

Для выделения некоторого числа новых факторов и построения необходимых для расчетов факторных показателей применяют прием расширения факторных моделей. При этом числитель и знаменатель умножаются на одно и тоже число:

.

Для построения новых факторных показателей применяют прием сокращения факторных моделей. При использовании данного приема числитель и знаменатель делят на одно и то же число.

.

Детализация факторного анализа во многом определяется числом факторов, влияние которых можно количественные оценить, поэтому большое значение в анализе имеют многофакторные мультипликативные модели. В основе их построения лежат следующие принципы:
· место каждого фактора в модели должно соответствовать его роли в формировании результативного показателя;
· модель должна строиться из двухфакторной полной модели путем последовательного расчленения факторов, как правило качественных, на составляющие;
· при написании формулы многофакторной модели факторы должны располагаться слева направо в порядке их замены.

Построение факторной модели – первый этап детерминированного анализа. Далее определяют способ оценки влияния факторов.

Способ цепных подстановок заключается в определении ряда промежуточных значений обобщающего показателя путем последовательной замены базисных значений факторов на отчетные. Данный способ основан на элиминировании. Элиминировать – значит устранить, исключить воздействие всех факторов на величину результативного показателя, кроме одного. При этом исходя из того, что все факторы изменяются независимо друг от друга, т.е. сначала изменяется один фактор, а все остальные остаются без изменения. потом изменяются два при неизменности остальных и т.д.

В общем виде применение способа цепных постановок можно описать следующим образом:

где a 0 , b 0, c 0 - базисные значения факторов, оказывающих влияние на обобщающий показатель у;

a 1 , b 1 , c 1 - фактические значения факторов;

y a , y b , - промежуточные изменения результирующего показателя, связанного с изменением факторов а, b, соответственно.

Общее изменение D у=у 1 –у 0 складывается из суммы изменений результирующего показателя за счет изменения каждого фактора при фиксированных значениях остальных факторов:

Рассмотрим пример:

Таблица 2

Исходные данные для факторного анализа

Показатели

Условные обозначения

Базисные значения

Фактические

значения

Изменение

Абсолютное (+,-)

Относительное (%)

Объем товарной продукции, тыс. руб.

Количество работников, чел

Выработка на одного работающего,

Анализ влияния на объем товарной продукции количества работников и их выработки проведем описанным выше способом на основе данных табл.2. Зависимость объема товарной продукции от данных факторов можно описать с помощью мультипликативной модели:

Тогда влияние изменения величины количества работников на обобщающий показатель можно рассчитать по формуле:

Таким образом, на изменение объема товарной продукции положительное влияние оказало изменение на 5 человек численности работников, что вызвало увеличение объема продукции на 730 тыс. руб. и отрицательное влияние оказало снижение выработки на 10 тыс. руб., что вызвало снижение объема на 250 тыс. руб. Суммарное влияние двух факторов привело к увеличению объема продукции на 480 тыс. руб.

Преимущества данного способа: универсальность применения, простота расчетов.

Недостаток метода состоит в том, что, в зависимости от выбранного порядка замены факторов, результаты факторного разложения имеют разные значения. Это связано с тем, что в результате применения этого метода образуется некий неразложимый остаток, который прибавляется к величине влияния последнего фактора. На практике точностью оценки факторов пренебрегают, выдвигая на первый план относительную значимость влияния того или иного фактора. Однако существуют определенные правила, определяющие последовательность подстановки:
· при наличии в факторной модели количественных и качественных показателей в первую очередь рассматривается изменение количественных факторов;
· если модель представлена несколькими количественными и качественными показателями, последовательность подстановки определяется путем логического анализа.

Под количественным факторами при анализе понимают те, которые выражают количественную определенность явлений и могут быть получены путем непосредственного учета (количество рабочих, станков, сырья и т.д.).

Качественные факторы определяют внутренние качества, признаки и особенности изучаемых явлений (производительность труда, качество продукции, средняя продолжительность рабочего дня и т.д.).

Способ абсолютных разниц является модификацией способа цепной подстановки. Изменение результативного показателя за счет каждого фактора способом разниц определяется как произведение отклонения изучаемого фактора на базисное или отчетное значение другого фактора в зависимости от выбранной последовательности подстановки:

Способ относительных разниц применяется для измерения влияния факторов на прирост результативного показателя в мультипликативных и смешанных моделях вида у = (а – в) . с. Он используется в случаях, когда исходные данные содержат определенные ранее относительные отклонения факторных показателей в процентах.

Для мультипликативных моделей типа у = а . в . с методика анализа следующая:

· находят относительное отклонение каждого факторного показателя:

· определяют отклонение результативного показателя у за счет каждого фактора

Пример. Воспользовавшись данными табл. 2, проведем анализ способом относительных разниц. Относительные отклонения рассматриваемых факторов составят:

Рассчитаем влияние на объем товарной продукции каждого фактора:

Результаты расчетов те же, что и при использовании предыдущего способа.

Интегральный метод позволяет избежать недостатков, присущих методу цепной подстановки, и не требует применения приемов по распределению неразложимого остатка по факторам, т.к. в нем действует логарифмический закон перераспределения факторных нагрузок. Интегральный метод позволяет достигнуть полного разложения результативного показателя по факторам и носит универсальный характер, т.е. применим к мультипликативным, кратным и смешанным моделям. Операция вычисления определенного интеграла решается с помощью ПЭВМ и сводится к построению подынтегральных выражений, которые зависят от вида функции или модели факторной системы.
1. Какие задачи управления решаются посредством экономического анализа?
2. Охарактеризуйте предмет экономического анализа.
3. Какие отличительные особенности характеризуют метод экономического анализа?
4. Какие принципы лежат в основе классификации приемов и способов анализа?
5. Какую роль в экономическом анализе выполняет способ сравнения?
6. Объясните способы построения детерминированных факторных моделей.
7. Опишите алгоритм применения наиболее простых способов детерминированного факторного анализа: способа цепных подстановок, способа разниц.
8. Охарактеризуйте достоинства и опишите алгоритм применения интегрального метода.
9. Приведите примеры задач и факторных моделей, к которым применяется каждый из методов детерминированного факторного анализа.

Это может быть интересно (избранные параграфы):



← Вернуться

×
Вступай в сообщество «shango.ru»!
ВКонтакте:
Я уже подписан на сообщество «shango.ru»