Conţinut
Când oamenii de știință, economiști sau statistici fac predicții bazate pe teorie și apoi adună date reale, au nevoie de o modalitate de a măsura variația dintre valorile prezise și cele măsurate. De obicei, se bazează pe eroarea medie pătrată (MSE), care este suma variațiilor punctelor de date individuale pătrate și împărțite la numărul de puncte de date minus 2. Când datele sunt afișate pe un grafic, determinați MSE cu însumând variațiile punctelor de date ale axelor verticale. Pe un grafic x-y, acestea ar fi valorile y.
De ce pătrat variațiile?
Înmulțirea variației dintre valorile preconizate și cele observate are două efecte dezirabile. Primul este să ne asigurăm că toate valorile sunt pozitive. Dacă una sau mai multe valori ar fi negative, suma tuturor valorilor ar putea fi nerealist de mică și o reprezentare slabă a variației reale între valorile prezise și cele observate. Al doilea avantaj al pătratului este de a acorda mai multă greutate diferențelor mai mari, ceea ce asigură că o valoare mare pentru MSE semnifică variații mari de date.
Algoritmul stocului de calcul al eșantionului
Să presupunem că aveți un algoritm care prezice zilnic prețurile unui anumit stoc. Luni, acesta prezice că prețul acțiunii va fi de 5,50 USD, marți va fi 6,00 USD, miercuri 6,00 USD, joi 7,50 USD și vineri 8,00 USD. Considerând luni ca ziua 1, aveți un set de puncte de date care apar astfel: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) și (5, 8.00). Prețurile reale sunt următoarele: luni 4,75 USD (1, 4,75); Marți 5,35 USD (2, 5,35); Miercuri 6,25 USD (3, 6,25); Joi 7,25 USD (4, 7,25); și vineri: 8,50 USD (5, 8,50).
Variațiile dintre valorile y ale acestor puncte sunt 0,75, 0,65, -0,25, 0,25 și -0,50 respectiv, unde semnul negativ indică o valoare prevăzută mai mică decât cea observată. Pentru a calcula MSE, mai întâi pătrate fiecare valoare de variație, care elimină semnele minus și produce 0,5625, 0,4225, 0,0625, 0,0625 și 0,25. Prin însumarea acestor valori se obține 1,36 și împărțirea la numărul de măsurări minus 2, care este 3, rezultă MSE, care se dovedește a fi 0,45.
MSE și RMSE
Valorile mai mici pentru MSE indică un acord mai strâns între rezultatele prezise și cele observate, iar o MSE de 0,0 indică un acord perfect. Este important să ne amintim, însă, că valorile variației sunt pătrate. Atunci când este necesară o măsurare a erorilor care se află în aceleași unități ca punctele de date, statisticienii iau eroarea medie a pătratului (RMSE). Acestea obțin acest lucru luând rădăcina pătrată a erorii pătrate medii. Pentru exemplul de mai sus, RSME ar fi de 0,671 sau aproximativ 67 de centi.