Коэффициент корреляции знаков фехнера. Коэффициент корреляции знаков (коэффициент Фехнера) Коэффициент корреляции знаков фехнера

При корреляционному связи вместе с исследуемым фактором или несколькими факторами при множественной корреляции на результативный признак оказывают влияние и другие факторы, которые не учитываются или не могут быть точно учтены. При этом действие их может быть направлена как в сторону повышения результативного признака, так и в сторону ее снижения. Итак, исследование связи происходит в условиях, когда эта связь в большей или меньшей степени затушевывается противоречивой действием других причин. Поэтому одна из задач корреляционного анализа состоит в определении тесноты связи между признаками, в определении силы воздействия исследуемого фактора (факторов) на результативный признак.

Теснота связи в корреляционному анализе характеризуется с помощью специального относительного показателя, который получил название коэффициента корреляции.

При парной линейной зависимости теснота связи определяется с помощью линейного коэффициента корреляции

Коэффициент корреляции находится в пределах от 0 к ±1. в Если коэффициент корреляции равен нулю, то связь отсутствует, а если единице, то связь функциональная. Знак при коэффициенте корреляции указывает на направление связи ("+" - прямой "-" - обратная). Чем ближе коэффициент корреляции к единице, тем связь между признаками теснее.

Квадрат коэффициента корреляции называется коэффициентом детерминации (г2). Он показывает, какая доля общей вариации результативного признака определяется исследуемым фактором. Если коэффициент детерминации выраженный в процентах, то его следует читать так: вариация (колебания) зависимой переменной на столько-то процентов обусловлена вариацией фактора.

Между линейным коэффициентом корреляции (г) и коэффициентом полной регрессии (Ь) связь:

Следовательно, зная коэффициент корреляции (г) и значения средних квадратических отклонений по х и в можно определить коэффициент регрессии (Ь) и наоборот, зная коэффициент регрессии (Ь) и соответствующие средние квадратические отклонения можно вычислить коэффициент корреляции (г).

При парной линейной зависимости коэффициент корреляции и коэффициент полной регрессии имеют одинаковые знаки (плюс, минус).

Линейный коэффициент корреляции предназначен для оценки степени тесноты связи при линейной зависимости. Для случаев нелинейной связи между признаками используется другая формула коэффициента корреляции, которая следует из правила сложения дисперсий:

Из приведенного равенства видно, что чем больше влияние фактора на результативный признак, тем в большей степени ее значение дисперсии ("м.гр) приближается к значению общей дисперсии результативного признака.

Соответственно, чем больше "м.гР и меньше ае.гр тем связь между признаками будет теснее и наоборот. Следовательно, отношение межгрупповой (факторной) и общей дисперсий используется для оценки тесноты связи между признаками. Формула коэффициента корреляции имеет вид:

Учитывая, щосг2я = о-а-огля!>, формулу коэффициента корреляции можно представить как

Обе формулы коэффициента корреляции применяются для расчета тесноты связи при любой форме связи.

Из правила сложения дисперсий видно, что значение коэффициента корреляции находится в пределах от 0 до 1. Знак коэффициента корреляции с формулы не выводится. Если изучается связь между двумя признаками (парная простая корреляция), то направление связи (знак перед г) определяется непосредственно за знаком перед коэффициентом регрессии линейного уравнения.

При парной криволинейной зависимости, теснота связи при линейной зависимости, определяется с помощью специального показателя, аналогичного рассмотренному выше коэффициента корреляции г.

Этот показатель (чтобы подчеркнуть его принадлежность к криволинейного связи) обозначают символом иг и называют индексом корреляции:

Числовое значение индекса корреляции аналогичное коэффициенту корреляции: если иг = 1 - связь функциональная, если иг = 0 - связь отсутствует; чем иг ближе к единице, тем связь между признаками теснее.

Если известны коэффициенты регрессии уравнения связи, то индекс корреляции можно определить по другой, более простой формуле. Так, при параболической зависимости формула индекса корреляции может быть представлена как

Теснота связи при множественной корреляции определяется с помощью коэффициента множественной корреляции (ее) и коэффициента множественной детерминации (її2). По содержанию они аналогичны коэффициентам корреляции и детерминации при парном связи. их вычисления основывается на сравнении межгрупповой (факторной) и общей дисперсий:

Эта формула может быть применена для определения тесноты связи при любой форме связи.

Величина рч. изменяется от 0 до 1 и рассматривается как положительная, поскольку при множественных зависимостях связь результативного признака с одними факторами может быть положительным, а с другими - отрицательным.

Для случая зависимости результативного признака от двух факторов формула коэффициента множественной корреляции имеет вид

где Ги - парные линейные коэффициенты корреляции.

Приведенная формула применяется для определения тесноты связи при линейной зависимости.

Для определения тесноты связи между результативным признаком и каждым фактором при исключены влияния других факторов определяют частные коэффициенты корреляции, которые характеризуют "чистая" влияние фактора на результативный признак. Для их расчета используются парные коэффициенты корреляции.

В случае зависимости результативного признака от двух факторов (х1 и х2) можно рассчитать три коэффициента частичной корреляции:

1) между в и х1 при исключении влияния х2:

Коэффициенты корреляции при парных и множественных связей, а также индекс корреляции - это относительные величины, поэтому они могут быть использованы для сопоставления тесноты связи по нескольким явлениях, которые анализируются.

Следует иметь в виду, что показатели тесноты связи зависят от размаха варьирования изучаемых признаков. Чем больше вариация переменных, тем выше будет величина показателей тесноты связи.

Определим тесноту связи между исследуемыми признаками для нашего примера. Поскольку между продуктивностью коров и уровнем кормления имеет место линейная связь, тесноту связи определим с помощью линейного коэффициента корреляции

Коэффициент корреляции показывает, что между продуктивностью коров и уровнем кормления имеет место тесная (сильная) связь.

Коэффициент детерминации г2 = 0,93442 = 0,8731 показывает, что 87,31% общего колебания продуктивности коров обусловлено различиями в уровне кормления, а остальные 12,69% (100 - 87,31) - другими факторами, которые в данном случае не было учтено.

Коэффициент корреляции можно найти и по другим формулам.

Коэффициент Фехнера - это оценка степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от средних значений факторного и результативного признаков. Коэффициент Фехнера наряду с такими коэффициентами, как коэффициент Спирмэна и коэффициент Кэндэла, относится к коэффициентам корреляции знаков . Коэффициент корреляции знаков основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Вычисляется он следующим образом:

A #n b " data-id="a;b" data-formul="(a-b)/(a+b)" data-r="K ф ">Рассчитать свое значение


Коэффициент Фехнера может принимать значения от –1 до +1. Kф = 1 свидетельствует о возможном наличии прямой связи, Kф=-1 свидетельствует о возможном наличии обратной связи.

Назначение сервиса . Данный сервис предназначен для расчета коэффициент Фехнера в онлайн режиме. Также определяется значимость данного коэффициента.

Инструкция . Укажите количество данных (количество строк), нажмите Далее. Полученное решение сохраняется в файле Word . Также автоматически создается шаблон для проверки решения в Excel .

Расчет коэффициента Фехнера состоит из следующих этапов:

  1. Определяют средние значения для каждого признака (X и Y).
  2. Определяют знаки отклонения (-,+) от среднего значения каждого из признаков.
  3. Если знаки совпадают, присваивают значение А, иначе В.
  4. Считают количество А и В, вычисляя коэффициент Фехнера по формуле: K ф = (n a - n b)/(n a + n b) где n a - число совпадений знаков отклонений индивидуальных величин от средней; n b - число несовпадений.
Коэффициент Фехнера изменяется в пределах [-1;+1] и применяется для оценки тесноты связи качественных признаков (непараметрические методы).

Графическое представление коэффициента Фехнера


Пример №1 . При разработке глинистого раствора с пониженной водоотдачей в высокотемпературных условиях проводили параллельное испытание двух рецептур, одна из которых содержала 2% КМЦ и 1% Na2CO3, а другая 2% КМЦ, 1% Na2CO3 и 0,1% бихромата калия. В результате получена следующие значения Х (водоотдача через 30 с).

X1 9 9 11 9 8 11 10 8 10
X2 10 11 10 12 11 12 12 10 9
Проверит, различимы ли рассматриваемые растворы по значению водоотдачи.

Пример №2 . Коэффициент корреляции знаков , или коэффициент Фехнера, основан на оценке степени согласованности направлений отклонений индивидуальных значений факторного и результативного признаков от соответствующих средних. Вычисляется он следующим образом:

,

где n a - число совпадений знаков отклонений индивидуальных величин от средней; n b - число несовпадений.

Коэффициент Фехнера может принимать значения от -1 до +1. Kф = 1 свидетельствует о возможном наличии прямой связи, Kф =-1 свидетельствует о возможном наличии обратной связи.

Пример №2
Рассмотрим на примере расчет коэффициента Фехнера по данным, приведенным в таблице:
Средние значения:


Знаки отклонений от средней X

Знаки отклонений от средней Y

Совпадение (а) или несовпадение (b) знаков


Значение коэффициента свидетельствует о том, что можно предполагать наличие обратной связи.

Оценка Коэффициента корреляции знаков.

Для оценки коэффициента Фехнера достаточно оценить его значимость и найти доверительный интервал.
Значимость коэффициента Фехнера.

По таблице Стьюдента находим t табл:
t табл (n-m-1;a) = (6;0.05) = 1.943
Поскольку Tнабл > tтабл, то отклоняем гипотезу о равенстве 0 коэффициента корреляции знаков. Другими словами, коэффициент Фехнера статистически - значим.


Доверительный интервал для коэффициента Фехнера:
r(-1.0;-0.4495)

Пример №3 .
Рассмотрим на примере расчет коэффициента корреляции знаков по данным, приведенным в таблице.

  • Ранговый коэффициент корреляции Кендалла.
    Расчетная формула имеет вид: Ранжируем все элементы по признаку х^, по ряду другого признака х 10 ): где иа/2 - квантиль, определяемый по таблице нормального распределения для выбранного уровня значимости а (например, для а = 0,05 получим иа/2 = 1,96). Если п 10, то рассчитывают...
    (Многомерные статистические методы в экономике)
  • Коэффициенты корреляции показателей состояния региональных подсистем с показателем инвестиций
    Коэффициент рождаемости -0,08 (р = 0,768) 0,10 (р = 0,707) Коэффициент смертности -0,36 (р = 0,158) -0,65 (р = 0,004) Коэффициент младенческой смертности -0,13 (р = 0,619) -0,40 (р = 0,113) Численность населения 0,98 (р = 0,000) 0,62 (р = 0,008) Ожидаемая продолжительность жизни при рождении, лет 0,20...
    (Развитие регионов: диагностика региональных различий)
  • Коэффициенты корреляции показателей состояния региональных подсистем с показателем инвестиций
    Коэффициент рождаемости -0,08 (р = 0,768) 0,10 (р = 0,707) Коэффициент смертности -0,36 (р = 0,158) -0,65 (р = 0,004) Коэффициент младенческой смертности -0,13 (р = 0,619) -0,40 (р = 0,113) Численность населения 0,98 (р = 0,000) 0,62 (р = 0,008) Ожидаемая продолжительность жизни при рождении, лет 0,20...
    (Развитие регионов: диагностика региональных различий)
  • Коэффициент корреляции рангов Спирмэна
    Данный коэффициент относится к ранговым, т. е. коррелируются не сами значения факторного и результативного признаков, а их ранги (номера их мест, занимаемых в каждом ряду значений по возрастанию или убыванию). Коэффициент корреляции рангов Спирмэна основан на рассмотрении разности рангов значений факторного...
    (Общая теория статистики)

Выводы:

Полученная величина коэффициента корреляции знаков равна нулю, так как число совпадений и число несовпадений знаков равны. Это основной недостаток данного показателя. По этому показателю можно предполагать, что взаимосвязь отсутствует.

Линейный коэффициент корреляции

Проверка существенности коэффициента корреляции:

Выводы:

Полученная величина линейного коэффициента корреляции указывает на то, что связь между долей в общем объеме поставок сжигаемых видов топлива и ожидаемой продолжительностью жизни при рождении умеренна, свидетельствует о наличии обратной зависимости.

Следовательно, с вероятностью 95% можно предположить, что корреляционная связь все же существенна.

Эмпирическое корреляционное отношение:

Проверка значимости эмпирического корреляционного отношения:

Выводы:

Полученное значение эмпирического корреляционного отношения свидетельствует о умеренной связи между исследуемыми признаками.

Следовательно, с вероятностью 95% можно сделать вывод о несущественности корреляционной связи между анализируемыми показателями.

Коэффициент корреляции рангов Спирмэна:

Выводы:

По результатам расчета коэффициента Спирмэна можно предположить о наличии слабой обратной зависимости между долей в общем объеме поставок сжигаемых видов топлива и ожидаемой продолжительностью жизни при рождении.

Коэффициент корреляции рангов Кендэла:

Выводы:

По рассчитанному коэффициенту корреляции рангов можно полагать о наличии слабой обратной зависимости между исследуемыми признаками.

· Проверка возможности использования линейной функции в качестве формы взаимосвязи

Считается возможным применять линейное уравнение корреляционной зависимости, но для проверки гипотезы о линейной зависимости более эффективно использовать величину .

Выводы:

Следовательно, гипотеза о линейности связи между долей в общем объеме поставок сжигаемых видов топлива и ожидаемой продолжительностью жизни при рождении верна.



Страны со средним уровнем развития человеческого потенциала

· Выявление факта наличия взаимосвязи между факторным и результативным признаком

Аналитическая группировка

Эмпирическая линия регрессии


Выводы:

Сравнив средние значения результативного признака по группам, можно увидеть следующую тенденцию: чем выше доля в общем объеме поставок сжигаемых видов топлива, тем больше ожидаемая продолжительность жизни при рождении (если не учитывать скачки, возможно обусловленные прочими факторами), т. е. можно предположить наличие прямой корреляционной зависимости между признаками.

Поле корреляции


Выводы:

Основная часть единиц формирует облако, располагающееся в основном из левого нижнего угла системы координат в правый верхний угол, можно предположить наличие прямой взаимосвязи между признаками.

Корреляционная таблица

При группировке по факторному признаку число групп равняется 6. При группировке по результативному признаку установим число групп, равное числу групп по факторному признаку, т. е. . Также исключим страны, по которым отсутствуют данные по факторному признаку, число стран сократилось до тридцати, т. е. .

Теперь составляем корреляционную таблицу:

Корреляционная таблица Средняя ожидаемая продолжительность жизни при рождении, лет
52,0-57,2 57,2-62,4 62,4-67,6 67,6-70,1 70,1-72,6 72,6-75,1 Итого
Доля в общем объеме поставок сжигаемых видов топлива, % 15-30
30-45
45-60
60-75
75-90
90-100
Итого

Выводы:

Затруднительно определить направление корреляционной связи, в основном частоты в корреляционной таблице расположены на диагонали из левого верхнего угла в правый нижний угол, т. е. большим значениям факторного признака соответствуют большие значения результативного, следовательно, можно предположить наличие прямой корреляционной зависимости между признаками.

· Показатели оценки степени тесноты взаимосвязи

Общее представление о корреляционно-регрессивном анализе

Существующие между явлениями формы и виды связей весьма разнообразны по своей классификации. являются только такие из них, которые имеют количественный характер и изучаются с помощью количественных методов. Рассмотрим метод корреляционно-регрессионного анализа, который является основным в изучении взаимосвязей явлений.

Данный метод содержит две свои составляющие части — корреляционный анализ и регрессионный анализ. Корреляционный анализ — это количественный метод определения тесноты и направления взаимосвязи между выборочными переменными величинами. Регрессионный анализ — это количественный метод определения вида математической функции в причинно-следственной зависимости между переменными величинами.

Для оценки силы связи в теории корреляции применяется шкала английского статистика Чеддока: слабая — от 0,1 до 0,3; умеренная — от 0,3 до 0,5; заметная — от 0,5 до 0,7; высокая — от 0,7 до 0,9; весьма высокая (сильная) — от 0,9 до 1,0. Она используется далее в примерах по теме.

Линейная корреляция

Данная корреляция характеризует линейную взаимосвязь в вариациях переменных. Она может быть парной (две коррелирующие переменные) или множественной (более двух переменных), прямой или обратной — положительной или отрицательной, когда переменные варьируют соответственно в одинаковых или разных направлениях.

Если переменные — количественные и равноценные в своих независимых наблюдениях при их общем количестве , то важнейшими эмпирическими мерами тесноты их линейной взаимосвязи являются коэффициент прямой корреляции знаков австрийского психолога Г.Т.Фехнера (1801-1887) и коэффициенты парной, чистой (частной) и множественной (совокупной) корреляции английского статистика-биометрика К.Пирсона (1857-1936).

Коэффициент парной корреляции знаков Фехнера определяет согласованность направлений в индивидуальных отклонениях переменных и от своих средних и . Он равен отношению разности сумм совпадающих () и несовпадающих () пар знаков в отклонениях и к сумме этих сумм:

Величина Кф изменяется от -1 до +1. Суммирование в (1) производится по наблюдениям, которые не указаны в суммах ради упрощения. Если какое-то одно отклонение или , то оно не входит в расчет. Если же сразу оба отклонения нулевые: , то такой случай считается совпадающим по знакам и входит в состав . В таблице 12.1. показана подготовка данных для расчета (1).

Таблица 12.1 Данные для расчета коэффициента Фехнера.

Число работников, тыс. чел.

Товарооборот, у.е.

Отклонение от средних

Сравнение знаков и

совпа-дение
(С к)

несов-падение (Н к)

По (1) имеем К ф = (3 — 2)/(3 + 2) = 0,20 . Направление взаимосвязи в вариациях!!Средняя численность работников|численности работников]] и — положительное (прямолинейное): знаки в отклонениях и и в своем большинстве (в 3 случаях из 5) совпадают между собой. Теснота взаимосвязи переменных по шкале Чеддока — слабая.

Коэффициенты парной, чистой (частной) и множественной (совокупной) линейной корреляции Пирсона, в отличие от коэффициента Фехнера, учитывают не только знаки, но и величины отклонений переменных. Для их расчета используют разные методы. Так, согласно методу прямого счета по несгруппированным данным, коэффициент парной корреляции Пирсона имеет вид:

Этот коэффициент также изменяется от -1 до +1. При наличии нескольких переменных рассчитывается коэффициент множественной (совокупной) линейной корреляции Пирсона. Для трех переменных x, y, z он имеет вид

Этот коэффициент изменяется от 0 до 1. Если элиминировать (совсем исключить или зафиксировать на постоянном уровне) влияние на и , то их "общая" связь превратится в "чистую", образуя чистый (частный) коэффициент линейной корреляции Пирсона:

Этот коэффициент изменяется от -1 до +1. Квадраты коэффициентов корреляции (2)-(4) называются коэффициентами (индексами) детерминации — соответственно парной, чистой (частной), множественной (совокупной):

Каждый из коэффициентов детерминации изменяется от 0 до 1 и оценивает степень вариационной определенности в линейной взаимосвязи переменных, показывая долю вариации одной переменной (y), обусловленную вариацией другой (других) — x и y. Многомерный случай наличия более трех переменных здесь не рассматривается.

Согласно разработкам английского статистика Р.Э. Фишера (1890-1962), статистическая значимость парного и чистого (частного) коэффициентов корреляции Пирсона проверяется в случае нормальности их распределения, на основании -распределения английского статистика В.С. Госсета (псевдоним "Стьюдент"; 1876-1937) с заданным уровнем вероятностной значимости и имеющейся степени свободы , где — число связей (факторных переменных). Для парного коэффициента имеем его среднеквадратическую ошибку и фактическое значение -критерия Стьюдента:

Для чистого коэффициента корреляции при расчете его вместо (n-2) надо брать , т.к. в этом случае имеется m=2 (две факторные переменные x и z). При большом числе n>100 вместо (n-2) или (n-3) в (6) можно брать n, пренебрегая точностью расчета.

Если t r > t табл. , то коэффициент парной корреляции — общий или чистый является статистически значимым, а при t r ≤ t табл. — незначимым.

Значимость коэффициента множественной корреляции R проверяется по F — критерию Фишера путем расчета его фактического значения

При F R > F табл. коэффициент R считается значимым с заданным уровнем значимости a и имеющихся степенях свободы и , а при F r ≤ F табл — незначимым.

В совокупностях большого объема n > 100 для оценки значимости всех коэффициентов Пирсона вместо критериев t и F применяется непосредственно нормальный закон распределения (табулированная функция Лапласа-Шеппарда).

Наконец, если коэффициенты Пирсона не подчиняются нормальному закону, то в качестве критерия их значимости используется Z — критерий Фишера, который здесь не рассматривается.

Условный пример расчета (2) — (7)дан в табл. 12.2, где взяты исходные данные табл.12.1 с добавлением к ним третьей переменной z — размера общей площади магазина (в 100 кв. м).

Таблица 12.2. Подготовка данных для расчета коэффициентов корреляции Пирсона

Показатели

Согласно (2) — (5), коэффициенты линейной корреляции Пирсона равны:

Взаимосвязь переменных x и y является положительной, но не тесной, составляя по их парному коэффициенту корреляции величину и по чистому — величину и оценивалась по шкале Чеддока соответственно как "заметная" и "слабая".

Коэффициенты детерминации d xy =0,354 и d xy . z = 0,0037 свидетельствуют, что вариация у (товарооборота) обусловлена линейной вариацией x (численности работников) на 35,4% в их общей взаимосвязи и в чистой взаимосвязи — только на 0,37% . Такое положение обусловлено значительным влиянием на x и y третьей переменной z — занимаемой магазинами общей площади. Теснота ее взаимосвязи с ними составляет соответственно r xz =0,677 и r yz =0,844 .

Коэффициент множественной (совокупной) корреляции трех переменных показывает, что теснота линейной взаимосвязи x и z c y составляет величину R = 0,844 , оцениваясь по шкале Чеддока как "высокая", а коэффициент множественный детерминации — величину D=0,713 , свидетельствуя, что 71,3 % всей вариации у (товарооборота) обусловлены совокупным воздействием на нее переменных x и z . Остальные 28,7% обусловлены воздействием на y других факторов или же криволинейной связью переменных y, x, z .

Для оценки значимости коэффициентов корреляции возьмем уровень значимости . По исходным данным имеем степени свободы для и для . По теоретической таблице находим соответственно t табл.1. = 3,182 и t табл.2. = 4,303. Для F-критерия имеем и и по таблице находим F табл. = 19,0. Фактические значения каждого критерия по (6) и (7) равны:

Все расчетные критерии меньше своих табличных значений: все коэффициенты корреляции Пирсона статистически незначимы.

Что еще почитать