Calcularea corelației în Excel: Ghidul dvs. de instrucțiuni
Publicat: 2022-07-13Microsoft Excel vă permite să faceți mai mult decât să creați simple foi de calcul - puteți utiliza și software-ul pentru a calcula funcții cheie, cum ar fi relația dintre două variabile. Cunoscută sub numele de coeficient de corelație, această măsurătoare este utilă pentru măsurarea impactului unei operațiuni asupra alteia pentru a informa operațiunile de afaceri.
Nu aveți încredere în abilitățile dumneavoastră Excel? Nici o problemă. Iată cum se calculează - și se înțelege - coeficientul de corelație în Excel.
Ce este corelația?
Corelația măsoară relația dintre două variabile. Un coeficient de corelație de 0 înseamnă că variabilele nu au niciun impact una asupra celeilalte - creșterile sau scăderile unei variabile nu au un efect consistent asupra celeilalte.
Un coeficient de corelație de +1 indică o „corelație pozitivă perfectă”, ceea ce înseamnă că pe măsură ce variabila X crește, variabila Y crește în aceeași rată. O valoare de corelație de -1, între timp, este o „corelație negativă perfectă”, ceea ce înseamnă că, pe măsură ce variabila X crește, variabila Y scade în același ritm. Analiza corelației poate returna, de asemenea, rezultate între -1 și +1, ceea ce indică faptul că variabilele se modifică la rate similare, dar nu identice.
Valorile de corelare pot ajuta companiile să evalueze impactul acțiunilor specifice asupra altor acțiuni. De exemplu, companiile pot descoperi că, pe măsură ce cheltuielile pentru marketing pe rețelele sociale cresc, la fel și implicarea clienților, indicând faptul că mai multe cheltuieli ar putea avea sens.
Sau pot descoperi că anumite campanii de publicitate au ca rezultat o scădere corelată a angajamentului clienților, sugerând, la rândul său, necesitatea unei reevaluări a eforturilor curente. Descoperirea că variabilele nu se corelează poate fi, de asemenea, valoroasă; în timp ce bunul simț ar putea sugera că o nouă funcție sau caracteristică a produsului dvs. s-ar corela cu o implicare sporită, este posibil să nu aibă un impact măsurabil. Analiza corelației permite companiilor să vadă această relație (sau lipsa acesteia) și să ia decizii strategice sănătoase.
Cum se calculează coeficientul de corelație în Excel
- Deschide Excel.
- Instalați pachetul de instrumente de analiză.
- Selectați „Date” din meniul barei de sus.
- Selectați „Analiza datelor” în colțul din dreapta sus.
- Selectați Corelație.
- Definiți intervalul și ieșirea dvs. de date.
- Evaluează-ți coeficientul de corelație.
Deci, cum calculezi coeficientul de corecție în Excel? Simplu! Urmați acești pași:
1. Deschideți Excel.
Pasul unu: Deschideți Excel și începeți o nouă foaie de lucru pentru datele variabile corelate. Introduceți punctele de date ale primei variabile în coloana A și ale celei de-a doua variabile în coloana B. Puteți adăuga variabile suplimentare și în coloanele C, D, E etc. — Excel va furniza un coeficient de corelație pentru fiecare dintre ele.
În exemplul de mai jos, am introdus șase rânduri de date în coloana A și șase în coloana B.
2. Instalați pachetul de instrumente de analiză.
Urmatorul? Dacă nu îl aveți, instalați Excel Analysis Toolpack.
Selectați „Fișier”, apoi „Opțiuni” și veți vedea acest ecran:
Selectați „Suplimente” și apoi faceți clic pe „Go”.
Acum, bifați caseta care spune „Analysis ToolPak” și faceți clic pe „Ok”.
3. Selectați „Date” din meniul barei de sus.
După ce ați instalat ToolPak-ul, selectați „Date” din meniul de sus al barei Excel. Aceasta vă oferă un submeniu care conține o varietate de opțiuni de analiză pentru datele dvs.
4. Selectați „Analiza datelor” în colțul din dreapta sus.
Acum, căutați „Analiza datelor” în colțul din dreapta sus și faceți clic pe el pentru a obține acest ecran:
5. Selectați Corelație.
Selectați Corelație din meniu și faceți clic pe „OK”.
6. Definiți intervalul de date și ieșirea.
Acum definiți intervalul de date și ieșirea. Puteți pur și simplu să faceți clic stânga și să trageți cursorul peste datele pe care doriți să le selectați, iar acesta se va completa automat în caseta de corelare. În cele din urmă, selectați un interval de ieșire pentru datele dvs. de corelare - am ales A8. Apoi, faceți clic pe „Ok”.
7. Evaluează-ți coeficientul de corelație.
Rezultatele corelației dvs. vor fi acum afișate. În exemplul nostru, valorile din coloana 1 și coloana 2 au o corelație negativă perfectă; pe măsură ce unul urcă, celălalt coboară în același ritm.
Matricea de corelație Excel
Rezultatele corelației Excel sunt cunoscute și ca o matrice de corelare Excel. În exemplul de mai sus, cele două coloane de date ale noastre au produs o matrice de corecție perfectă de 1 și -1. Dar ce se întâmplă dacă producem o matrice de corelație cu un set de date mai puțin ideal?
Iată datele noastre:
Și iată matricea:
Celula C4 din matrice ne oferă corelația dintre coloana 3 și coloana 2, care este un foarte slab 0,01025, în timp ce coloana 1 și coloana 3 oferă o corelație negativă mai puternică de -0,17851. Cu toate acestea, de departe cea mai puternică corelație este între coloana 1 și coloana 2 la -0,66891.
Deci, ce înseamnă asta în practică? Să presupunem că examinăm impactul acțiunilor specifice asupra eficacității unei campanii de social media, unde coloana 1 reprezintă numărul de vizitatori care fac clic pe reclame sociale, iar coloanele 2 și 3 reprezintă două sloganuri de marketing diferite. Matricea de corelație arată o corelație negativă puternică între Coloanele 1 și 2, ceea ce sugerează că versiunea din coloana 2 a sloganului a scăzut semnificativ implicarea generală a utilizatorilor, în timp ce coloana 3 a determinat doar o scădere ușoară.
Crearea regulată a matricelor Excel poate ajuta companiile să înțeleagă mai bine impactul unei variabile asupra alteia și să determine ce efecte negative sau pozitive (dacă există) pot exista.
Formula de corelare Excel
Dacă preferați să introduceți singur formula de corelare, aceasta este și o opțiune. Iată cum arată:
X și Y sunt măsurătorile tale, ∑ este suma, iar X și Y cu barele deasupra indică valoarea medie a măsurătorilor. L-ați calcula după cum urmează:
- Calculați suma variabilei X minus media lui X.
- Calculați suma variabilei Y minus media lui Y.
- Înmulțiți aceste două rezultate și lăsați acel număr deoparte (acesta este primul rezultat).
- Pătrat suma lui X minus media lui X. Pătrat suma lui Y minus media lui Y. Înmulțiți aceste două numere.
- Luați rădăcina pătrată (acesta este al doilea rezultat).
- Împărțiți primul rezultat la al doilea rezultat.
- Obțineți coeficientul de corelație.
Ușor, nu? Da și nu. Deși conectarea numerelor nu este complicată, este adesea mai multe probleme decât merită să creați și să gestionați această formulă. Pachetul de instrumente Excel încorporat este adesea o modalitate mai simplă (și mai rapidă) de a identifica coeficienții și de a descoperi relațiile cheie.
Corelație ≠ Nu o cauză
Niciun articol despre corelație nu este complet fără mențiunea că nu este egală cu cauzalitatea. Cu alte cuvinte, doar pentru că două variabile cresc sau scad împreună nu înseamnă că o variabilă este cauza creșterii sau scăderii celeilalte variabile.
Luați în considerare câteva exemple foarte ciudate.
Această imagine arată o corelație negativă aproape perfectă între numărul de pirați și temperatura medie globală - pe măsură ce pirații au devenit mai rari, temperatura medie a crescut.
Problema? În timp ce aceste două variabile sunt corelate, nu există nicio legătură cauzală între cele două; temperaturile mai ridicate nu au redus populația de pirați și mai puțini pirați nu au provocat încălzirea globală.
În timp ce corelația este un instrument puternic, ea indică doar direcția de creștere sau scădere între două variabile - nu cauza acestei creșteri sau scăderi. Pentru a descoperi legăturile cauzale, companiile trebuie să crească sau să scadă o variabilă și să observe impactul. De exemplu, dacă corelația arată că implicarea clienților crește odată cu cheltuielile din rețelele sociale, merită să optați pentru o creștere ușoară a cheltuielilor urmată de o măsurare a rezultatelor. Dacă mai multe cheltuieli duc direct la o implicare sporită, legătura este atât corelată, cât și cauzală. Dacă nu, poate exista unul (sau mai mulți) factori care susțin creșterea ambelor variabile.
Ține pasul cu corelațiile
Corelațiile Excel oferă un punct de plecare solid pentru dezvoltarea strategiei de marketing, vânzări și cheltuieli, dar nu spun întreaga poveste. Drept urmare, merită să utilizați opțiunile de analiză a datelor încorporate în Excel pentru a evalua rapid corelația dintre două variabile și pentru a utiliza aceste date ca punct de plecare pentru o analiză mai aprofundată.