Multiple corelare - studopediya
Semnificația practică a ecuației de regresie multiplă este evaluată cu ajutorul indicelui de corelație multiplă și un pătrat - coeficientul de determinare.
Coeficientul de determinare a variației indică proporția variabilă rezultată, sub influența variabilelor factorului, adică Ea determină cât de mult din variația caracteristică este luată în considerare în modelul și datorită influenței asupra lui a factorilor incluși în model:
Coeficientul de corelație multiplă poate fi obținut ca rădăcina pătrată a coeficientului de determinare. Cu cât coeficientul de corelație este de unitate, cu cât relația dintre rezultatul și toți factorii și ecuația de regresie descrie mai bine datele reale. În cazul în care coeficientul de corelație multiplă este aproape de zero, ecuația de regresie descrie prost datele reale, și factori au un efect redus asupra rezultatului. Acest raport este în contrast cu perechea de coeficientul de corelație nu poate fi folosit pentru a interpreta direcția de conectare.
Multiple valoarea coeficientului de corelație este mai mare sau egală cu perechea maximă coeficientul de corelație:
Pentru regresie liniară multiplă Coeficientul de corelație multiplă poate fi calculată utilizând următoarea formulă:
În consecință, coeficientul multiplu de determinare:
Există o altă formulă pentru calcularea unui coeficient de corelație multiplă pentru regresie liniară:
în care - determinantul matricei completă a coeficienților de corelație liniară pereche (adică, format din coeficienți liniari pereche de corelare cu rezultatul factorilor și unul de altul):
- factorii determinanți ai corelație între o pereche de coeficienți matrice liniare:
Calculat ca coeficientul de determinare ajustat:
unde n - numărul de observații;
m - numărul parametrilor ecuației de regresie excluzând elementul liber (pentru regresie liniară, de exemplu, acest număr este egal cu numărul de factori incluși în model).
Coeficientul de determinare ajustat este folosit în două scopuri: evaluarea unei etanșeității legătură reală între rezultatul și factorii de comparație și modelele cu număr diferit de parametri. În primul caz, să acorde o atenție apropierii coeficientului de determinare corectat și necorectate. Dacă aceste cifre sunt mari și diferă doar puțin, modelul este considerat bun.
Atunci când se compară diferite modele sunt preferate celei în care coeficientul ajustat mai lung de determinare, ceteris paribus.
Trebuie remarcat faptul că domeniul de aplicare al coeficientului de determinare ajustat limitat doar la aceste sarcini. Nu poate fi utilizat în formule, dacă este cazul determinării raportul obișnuit. Coeficientul de determinare ajustat nu poate fi interpretată ca o proporție din variația rezultat a explicat factorii de variație incluse în modelul de regresie.
Pentru a testa semnificația coeficientului de corelație multiplă folosind Fisher F-test, care este definit prin formula:
în care R2 - coeficient multiplu de determinare;
m - numărul de parametri în factorul X în ecuația de regresie multiplă (regresie în m abur = 1).
Valoarea obținută a F-test este comparată cu tabelul de la un anumit nivel de semnificație, și m și n-m-1 grade de libertate. Dacă valoarea calculată a testului F peste masa, ecuația de regresie multiplă este recunoscută semnificativă.