Puteți utiliza un test T pe date clasate?

Posted on
Autor: Judy Howell
Data Creației: 28 Iulie 2021
Data Actualizării: 15 Noiembrie 2024
Anonim
Classification in Machine Learning  | Machine Learning Tutorial | Python Training | Edureka
Video: Classification in Machine Learning | Machine Learning Tutorial | Python Training | Edureka

Conţinut

Testele statistice sunt utilizate pentru a determina dacă o relație ipotezată între variabile are semnificație statistică. De obicei, testul va măsura gradul în care variabilele se corelează sau diferă. Testele parametrice sunt cele care se bazează pe tendințele centrale ale variabilelor și presupun o distribuție normală. Testele non-parametrice nu fac presupuneri cu privire la distribuțiile populației.

T-test

Testul t este un test parametric care compară mijloacele de probe și populațiile implicate. Există mai multe varietăți de teste T. Un test t cu un eșantion compară media unui eșantion cu o medie ipotezată. Un test t teste independente examinează dacă mijloacele a două probe diferite au valori similare. Un test t-eșantion pereche este utilizat atunci când există două observații pentru a compara pentru fiecare subiect din eșantion. Testul t este proiectat pentru date numerice care au o distribuție normală.

Date ordinale

Datele ordinale sunt date derivate care descriu valorile relative ale fiecărei unități din eșantion. De exemplu, datele ordinare ale înălțimii a 10 elevi dintr-o clasă ar fi pur și simplu numerele 1 până la 10, unde 1 ar putea reprezenta cel mai scurt student și 10 ar putea reprezenta cel mai înalt student. Niciun elev nu ar avea aceeași valoare decât dacă ar avea exact aceeași înălțime. Măsurile de tendință centrală sunt lipsite de sens cu datele ordinale.

Neadecvarea testului T

Testele T nu sunt adecvate pentru a fi utilizate cu date ordinale. Deoarece datele ordinale nu au o tendință centrală, de asemenea, nu au o distribuție normală. Valorile datelor ordinale sunt distribuite uniform, nu sunt grupate în jurul unui punct intermediar. Din această cauză, un test t al datelor ordinale nu ar avea nici o semnificație statistică.

Alte teste adecvate

Există trei teste cu semnificație statistică care sunt adecvate pentru utilizarea cu date ordinale. Corelația rang-ordine a lui Spearman este adecvată pentru a fi utilizată atunci când există doar două variabile implicate, iar relația lor este monotonă, deși nu neapărat liniară. În relațiile monotonice, pe măsură ce prima variabilă crește, nu se schimbă direcția celei de-a doua variabile. Testul Kruskal-Wallis este proiectat pentru cazuri în care există mai mult de două probe, iar datele nu sunt distribuite în mod normal. Este similar cu o analiză unidirecțională a variației. Analiza Friedman a variației pe rânduri poate fi utilizată atunci când există trei sau mai multe observații ale unei singure variabile într-un singur grup.