Коефіцієнт кореляції (визначення, формула) | Як розрахувати?

Що таке коефіцієнт кореляції?

Коефіцієнт кореляції використовується для визначення того, наскільки сильним є взаємозв'язок між двома змінними, і його значення можуть коливатися від -1,0 до 1,0, де -1,0 означає негативну кореляцію, а +1,0 - позитивну залежність. Він враховує відносні рухи змінних, а потім визначає, чи існує між ними зв'язок.

Формула коефіцієнта кореляції

Де

  • r = коефіцієнт кореляції
  • n = кількість спостережень
  • x = 1-а змінна в контексті
  • y = 2-а змінна

Пояснення

Якщо існує якась кореляція або скажімо взаємозв'язок між двома змінними, тоді вона вказує, якщо одна зі змінних змінює значення, тоді інша змінна також буде мати тенденцію до зміни значення, скажімо в конкретному, яке може бути або в тому ж, або в протилежному напрямку . Частина чисельника рівняння проводить тест і відносну силу змінних, що рухаються разом, а знаменна частина рівняння масштабує чисельник шляхом множення відмінностей змінних від квадратних змінних.

Приклади

Завантажити цей шаблон коефіцієнта кореляції формули Excel можна тут - Шаблон формули коефіцієнта кореляції Excel

Приклад №1

Розглянемо наступні дві змінні x andy, вам потрібно розрахувати коефіцієнт кореляції.

Нижче наведені дані для розрахунку

Рішення:

Використовуючи наведене вище рівняння, ми можемо обчислити наступне

Ми маємо всі значення в наведеній вище таблиці з n = 4.

Давайте тепер введемо значення для розрахунку коефіцієнта кореляції.

Отже, розрахунок здійснюється наступним чином,

r = (4 * 25 032,24) - (262,55 * 317,31) / √ [(4 * 20 855,74) - (262,55) 2] * [(4 * 30 058,55) - (317,31) 2]

r = 16 820,21 / 16 831,57

Коефіцієнт буде -

Коефіцієнт = 0,99932640

Приклад №2

Країна Х - країна, що зростає, і вона хоче провести незалежний аналіз рішень, прийнятих центральним банком щодо змін процентних ставок, чи вплинули вони на інфляцію та чи може центральний банк контролювати це.

Далі подано короткий зміст процентної ставки та рівня інфляції, що панували в країні в середньому за ці роки.

Нижче наведені дані для розрахунку.

Президент країни звернувся до вас, щоб провести аналіз та провести презентацію щодо цього на наступній зустрічі. Використовуйте кореляцію та визначте, чи досяг центральний банк своєї мети чи ні.

Рішення:

Використовуючи обговорену вище формулу, ми можемо розрахувати коефіцієнт кореляції. Розглядаючи процентну ставку як одну змінну, скажімо x, а інфляцію - як іншу змінну, як y.

Ми маємо всі значення в наведеній таблиці з n = 6.

Давайте тепер введемо значення для розрахунку коефіцієнта кореляції.

r = (6 * 170,91) - (46,35 * 22,24) / √ [(6 * 361,19) - (46,35) 2] * [(6 * 82,74) - (22,24) 2]

r = -5,36 / 5,88

Кореляція буде -

Кореляція = -0,92

Аналіз: Здається, співвідношення між процентною ставкою та рівнем інфляції є негативним, що, здається, є правильним співвідношенням, оскільки процентна ставка зростає, інфляція зменшується, а це означає, що вони, як правило, рухаються в протилежному напрямку один від одного, а згори виходить центральний банк успішно реалізував рішення, пов'язане з політикою процентних ставок.

Приклад №3

Лабораторія ABC проводить дослідження зросту та віку та хотіла дізнатися, чи існує між ними зв'язок. Вони зібрали вибірку з 1000 людей для кожної з категорій і придумали середній зріст у цій групі.

Нижче наведені дані для розрахунку коефіцієнта кореляції.

Ви повинні розрахувати коефіцієнт кореляції і прийти до висновку, що якщо існує якась залежність.

Рішення:

Розглядаючи вік як одну змінну, скажімо x, а висоту (у см) як іншу змінну як y.

Ми маємо всі значення в наведеній таблиці з n = 6.

Давайте тепер введемо значення для розрахунку коефіцієнта кореляції.

r = (6 * 10,137) - (70 * 850) / √ [(6 * 940 - (70) 2] * [(6 * 1,20,834) - (850) 2]

r = 1322,00 / 1361,23

Кореляція буде -

Кореляція = 0,971177099

Актуальність та використання

Він використовується в статистиці головним чином для аналізу міцності взаємозв'язку між змінними, які розглядаються, а також він також вимірює, чи існує якийсь лінійний зв'язок між даними наборами даних та наскільки вони можуть бути пов'язані. Одним із найпоширеніших показників, які використовуються для кореляції, є коефіцієнт кореляції Пірсона.

Якщо змінна змінюється у значенні та разом із цією іншою змінною змінюється у значенні, тоді розуміння цього відношення є критичним, оскільки можна використовувати значення першої змінної для прогнозування зміни значення другої змінної. Сьогодні кореляція має багато різноманітних звичаїв, як це застосовується у фінансовій галузі, наукових дослідженнях, і де ні. Однак важливо знати, що кореляція має три основні типи взаємозв’язків. Перший - це позитивний зв’язок, який стверджує, що якщо зміна значення змінної змінюється, то відбудеться зміна пов’язаної змінної в тому ж напрямку, аналогічно, якщо є негативний зв’язок, тоді пов’язана змінна буде поводитися протилежний напрямок. Крім того, якщо немає кореляції, тоді r буде означати нульове значення.Дивіться зображення нижче, щоб краще зрозуміти концепцію.