Ce sunt lacunele, clusterele și valorile în matematică?

Posted on
Autor: Louise Ward
Data Creației: 11 Februarie 2021
Data Actualizării: 6 Iulie 2024
Anonim
Ce sunt lacunele, clusterele și valorile în matematică? - Ştiinţă
Ce sunt lacunele, clusterele și valorile în matematică? - Ştiinţă

Conţinut

Activitățile de afaceri, guvernamentale și academice necesită aproape întotdeauna colectarea și analiza datelor. Unul dintre modurile de a reprezenta datele numerice este prin grafice, histograme și diagrame. Aceste tehnici de vizualizare permit oamenilor să cunoască mai bine problemele și să creeze soluții. Lacune, clustere și contururi sunt caracteristici ale seturilor de date care influențează analiza matematică și sunt ușor vizibile pe reprezentările vizuale.

Găuri în Date

Golurile se referă la zone lipsă dintr-un set de date. De exemplu, dacă un experiment științific colectează date de temperatură în intervalul de 50 de grade Fahrenheit până la 100 de grade Fahrenheit, dar nimic între 70 și 80 de grade, aceasta ar reprezenta un decalaj în setul de date. O diagramă liniară a acestui set de date ar avea marcaje "x" pentru temperaturi cuprinse între 50 și 70 și din nou între 80 și 100, dar nu ar fi nimic între 70 și 80. Cercetătorii pot săpa mai adânc și pot explora de ce anumite puncte de date nu apar. într-un eșantion colectat.

Grupuri izolate

Clusterele sunt grupuri izolate de puncte de date. Graficele de linii, care sunt una dintre modalitățile de a reprezenta seturi de date, sunt linii cu mărci "x" plasate deasupra numerelor specifice pentru a descrie frecvența lor de apariție în setul de date. Un cluster este descris ca o colecție de aceste mărci "x" într-un interval mic sau subset de date. De exemplu, dacă punctele de examen pentru o clasă de 10 studenți sunt 74, 75, 80, 72, 74, 75, 76, 86, 88 și 73, cele mai multe „x” note de pe un traseu de linie ar fi în 72- intervalul de scor până la -76. Aceasta ar reprezenta un cluster de date. Rețineți că frecvența pentru 74 și 75 este de două, dar pentru toate celelalte scoruri, este una.

La extreme

Outliers sunt valori extreme - puncte de date care se află semnificativ în afara altor valori dintr-un set de date. O valoare anterioară trebuie să fie semnificativ mai mică sau mai mare decât majoritatea numerelor dintr-un set de date. Definiția de „extremă” depinde de circumstanță și de un consens al analiștilor implicați în cercetare. Valorile relevante ar putea fi puncte rele de date, cunoscute și sub denumirea de zgomot, sau ar putea conține informații valoroase despre fenomenul investigat și despre metodologia de colectare a datelor în sine. De exemplu, dacă scorurile de clasă se află în cea mai mare parte în intervalul 70-80, dar câteva scoruri sunt în anii 50 scăzute, acestea ar putea reprezenta valori superioare.

Punându-l la capăt

Golurile, valorile și grupurile din seturile de date pot afecta rezultatele analizei matematice. Lacunele și grupurile pot reprezenta erori în metodologia de colectare a datelor. De exemplu, dacă un sondaj telefonic sondează doar anumite coduri de zonă, cum ar fi complexele de locuințe cu venituri mici sau zonele rezidențiale suburbane și nu o secțiune largă a populației, este posibil să existe lacune și clustere în date. . Outliers pot varia media sau valoarea medie a unui set de date. De exemplu, media sau valoarea medie a unui set de date format din patru numere - 50, 55, 65 și 90 - este 65. Fără cele 90 anterioare, media este aproximativ 57.