O diagramă de împrăștiere este un instrument de diagnostic important în arsenalul unui statistician, obținut prin graficarea a două variabile una față de cealaltă. Permite statisticianului să analizeze variabilele și să formeze o ipoteză de lucru despre relația lor. Din acest motiv, este de obicei desenat înainte de efectuarea unei analize de regresie. Statisticianul testează ulterior ipoteza folosind o analiză de regresie și determină semnul și amploarea precisă a relației. Mai mult, un complot de dispersie ajută la identificarea valorilor exterioare - valori care sunt anormal de îndepărtate de majoritatea datelor din eșantion. Eliminarea valorilor exterioare ajută la îmbunătățirea modelului de regresie.
Verificați dacă există relații negative între cele două variabile din graficul de împrăștiere. Dacă valorile scăzute ale primei variabile corespund valorilor ridicate ale celei de-a doua variabile, există o corelație negativă. În acest caz, o linie trasată prin punctele de date are o pantă negativă.
Examinați graficul de dispersie pentru relația pozitivă dintre variabile. Dacă valorile scăzute ale primei variabile din graficul de împrăștiere corespund cu valori scăzute ale celei de-a doua, iar valorile mari ale primei corespund în mod similar cu valorile mari ale celei de-a doua, variabilele au o corelație pozitivă. În acest caz, o linie trasată prin punctele de date are o pantă pozitivă.
Inspectați graficul de dispersie pentru a nu exista relații între variabile. Dacă punctele de date din graficul de împrăștiere sunt distribuite aleatoriu fără nicio relație aparentă între cele două, acestea nu au nici o corelație, fie o corelație statistică nesemnificativă. În acest caz, o linie trasată prin punctele de date este orizontală cu panta egală cu zero.
Încadrați o linie prin punctele de date și examinați forma acesteia pentru a măsura natura relației dintre cele două variabile. O linie dreaptă este interpretată ca o relație liniară, o formă curbă sugerează o relație cvadratică și o linie care se află relativ plat înainte de a trage brusc în sus sau în jos este interpretată ca o relație exponențială.
Examinați graficul de dispersie pentru valori, care se află anormal de departe de grupul de puncte de date. Outliers denatura relația dintre variabile. Eliminați-le, dar numai dacă absența lor nu afectează analiza relației dintre cele două variabile.