Cum să găsiți coeficientul de corelație pentru „R” într-o diagramă Scatter

Posted on
Autor: Laura McKinney
Data Creației: 9 Aprilie 2021
Data Actualizării: 1 Decembrie 2024
Anonim
Cum să găsiți coeficientul de corelație pentru „R” într-o diagramă Scatter - Ştiinţă
Cum să găsiți coeficientul de corelație pentru „R” într-o diagramă Scatter - Ştiinţă

Conţinut

Găsirea puterii asocierii dintre două variabile este o abilitate importantă pentru oamenii de știință de toate tipurile. Dacă două variabile sunt corelate între ele, arată că există o legătură între ele. O corelație pozitivă înseamnă că atunci când o variabilă crește, cealaltă o face și o corelație negativă înseamnă că atunci când o variabilă crește, cealaltă scade. Corelațiile nu dovedesc cauzalitate, deși este posibil ca teste suplimentare să dovedească o relație de cauzalitate între variabile. Coeficientul de corelație R arată puterea relației dintre cele două variabile și dacă este o corelație pozitivă sau negativă.

TL; DR (Prea lung; nu a citit)

Apelați o variabilă X și o variabilă y. Calculați valoarea de R folosind formula:

R = ÷ √ {}

Unde n este dimensiunea dvs. de eșantion.

    Faceți un tabel cu datele dvs. Aceasta ar trebui să includă o coloană pentru numărul de participant, o coloană pentru prima variabilă (etichetată X) și o coloană pentru a doua variabilă (etichetată y). De exemplu, dacă căutați să vedeți dacă există o corelație între înălțimea și dimensiunea pantofului, o coloană ar identifica fiecare persoană pe care o măsurați, o coloană ar arăta înălțimea fiecărei persoane și alta ar arăta dimensiunea pantofului. Realizați trei coloane suplimentare, una pentru X y, unul pentru X2 și unul pentru y2.

    Utilizați datele dvs. pentru a completa cele trei coloane suplimentare. De exemplu, imaginați-vă că prima dvs. persoană măsoară 75 cm înălțime și are dimensiunea de 12 picioare. X coloana (înălțime) ar arăta 75 și y coloana (dimensiunea pantofului) ar arăta 12. Trebuie să găsiți X y, X2 și y2. Prin urmare, folosind acest exemplu:

    xy = 75 × 12 = 900

    X2 = 752 = 5,625

    y2 = 122 = 144

    Completați aceste calcule pentru fiecare persoană pentru care aveți date.

    Creați un nou rând în partea de jos a tabelului pentru sumele fiecărei coloane. Adăugați toate elementele X valori, toate y valori, toate X y valori, toate X2 valorile și toate y2 valori, apoi puneți rezultatele în partea de jos a coloanei corespunzătoare din noul rând. Puteți eticheta noul rând „sumă” sau puteți utiliza un simbol sigma (Σ).

    Veți găsi R din datele dvs. folosind formula:

    R = ÷ √ {}

    Acest lucru pare un pic descurajant, așa că îl puteți împărți în două părți, pe care le vom numi s și T.

    s = n (Σxy) - (Σx) (Σy)

    t = √ {}

    În aceste ecuații, n este numărul de participanți pe care îl aveți (dimensiunea eșantionului dvs.). Restul părților ecuației sunt sumele pe care le-ați calculat în ultimul pas. Prin urmare s, înmulțiți dimensiunea eșantionului cu suma X y și apoi scade suma X coloana înmulțită cu suma y coloana din aceasta.

    Pentru T, există patru etape principale. În primul rând, calculați n înmulțit cu suma dvs. X2 și apoi scadeți suma dvs. X coloana pătrată (înmulțită de la sine) din această valoare. În al doilea rând, faceți exact același lucru, dar cu suma y2 coloana și suma y coloana pătrată în locul X piese (adică n × Σy2 -). În al treilea rând, înmulțiți aceste două rezultate (pentru Xs și ys) împreună. În al patrulea rând, luați rădăcina pătrată a acestui răspuns.

    Dacă ați lucrat în părți, puteți calcula R ca simplu R = s ÷ t. Veți obține un răspuns între −1 și 1. Un răspuns pozitiv arată o corelație pozitivă, cu ceva peste 0,7 fiind considerat în general o relație puternică. Un răspuns negativ arată o corelație negativă, cu peste peste -0,7 considerat o relație negativă puternică. În mod similar ± 0,5 este considerată o relație moderată și ± 0,3 este considerată o relație slabă. Orice apropiere de 0 arată o lipsă de corelație.