Avantajele și dezavantajele unui model de regresie multiplă

Posted on
Autor: Laura McKinney
Data Creației: 9 Aprilie 2021
Data Actualizării: 17 Noiembrie 2024
Anonim
Linear Regression and Some Alternatives for Predictive Regression
Video: Linear Regression and Some Alternatives for Predictive Regression

Conţinut

Regresia multiplă este utilizată pentru a examina relația dintre mai multe variabile independente și o variabilă dependentă. În timp ce modelele de regresie multiplă vă permit să analizați influențele relative ale acestor variabile independente sau predictoare, variabile dependente sau criterii, variabile, aceste seturi de date deseori complexe pot duce la concluzii false dacă nu sunt analizate corect.

Exemple de regresie multiplă

Un agent imobiliar ar putea folosi regresia multiplă pentru a analiza valoarea caselor. De exemplu, ea ar putea folosi ca variabile independente mărimea caselor, vârsta lor, numărul de dormitoare, prețul mediu al locuinței în cartier și apropierea de școli. Concentrând acestea într-un model de regresie multiplă, ea ar putea apoi să folosească acești factori pentru a vedea relația lor cu prețurile locuințelor ca variabilă de criteriu.

Un alt exemplu de utilizare a unui model de regresie multiplă ar putea fi cineva din resursele umane care determină salariul funcțiilor de conducere - variabila de criteriu. Variabilele predictoare ar putea fi vechimea fiecărui manager, numărul mediu de ore lucrate, numărul de persoane gestionate și bugetul departamentului managerilor.

Avantajele regresiei multiple

Există două avantaje principale pentru analizarea datelor utilizând un model de regresie multiplă. Prima este abilitatea de a determina influența relativă a uneia sau mai multor variabile predictoare asupra valorii criteriului. Agentul imobiliar ar putea constata că mărimea locuințelor și numărul de dormitoare au o corelație puternică cu prețul unei locuințe, în timp ce apropierea de școli nu are deloc corelație sau chiar o corelație negativă dacă este în primul rând o pensie. comunitate.

Al doilea avantaj este capacitatea de a identifica valorile exterioare sau anomaliile. De exemplu, în timp ce a analizat datele referitoare la salariile de conducere, managerul de resurse umane a putut constata că numărul de ore lucrate, dimensiunea departamentului și bugetul său au avut o corelație puternică cu salariile, în timp ce vechimea nu. În mod alternativ, s-ar putea ca toate valorile de previziuni enumerate să fie corelate cu fiecare din salariile examinate, cu excepția unui manager care a fost plătit în comparație cu ceilalți.

Dezavantaje ale regresiei multiple

Orice dezavantaj al utilizării unui model de regresie multiplă se referă de obicei la datele utilizate. Două exemple sunt utilizarea datelor incomplete și concluzia falsă a unei corelații este o cauzalitate.

Când revizuiți prețul locuințelor, de exemplu, să presupunem că agentul imobiliar a privit doar 10 case, dintre care șapte au fost achiziționate de părinți tineri. În acest caz, relația dintre proximitatea școlilor o poate determina să creadă că acest lucru a avut un efect asupra prețului de vânzare pentru toate casele vândute în comunitate. Aceasta ilustrează capcanele datelor incomplete. Dacă ar fi folosit un eșantion mai mare, ar fi putut constata că, din 100 de case vândute, doar zece la sută din valorile casei erau legate de o proximitate a școlilor. Dacă ar fi folosit vârstele cumpărătorilor ca valoare predictoare, ar fi putut constata că cumpărătorii mai tineri erau dispuși să plătească mai mult pentru locuințele din comunitate decât cumpărătorii mai mari.

În exemplul salariilor de conducere, să presupunem că a existat unul care avea un buget mai mic, mai puțin vechime și cu mai puțin personal de gestionat, dar făcea mai mult decât oricine altcineva. Managerul de resurse umane ar putea analiza datele și a concluziona că această persoană este plătită în exces. Cu toate acestea, această concluzie ar fi eronată dacă nu ar ține cont de faptul că acest manager era responsabil de site-ul companiei și avea o competență extrem de râvnită în domeniul securității rețelei.