Ugrás a tartalomhoz

Matematikai statisztikai elemzések 6., Regressziószámítás: kétváltozós lineáris és nemlineáris regresszió, többváltozós regresszió

Prof. Dr. Závoti József (2010)

Nyugat-magyarországi Egyetem

6.4 Többváltozós regresszió számítás

6.4 Többváltozós regresszió számítás

A kétváltozós regressziós modell azzal a feltételezéssel él, hogy a megfigyelt eredményváltozó csupán egyetlen magyarázóváltozó hatására jött létre. Azonban a jelenségek többségére inkább az igaz, hogy kialakulásukért több tényező a felelős. (pl.: egy használtautó eladási ára nemcsak a korának, de a futott kilométereknek is a függvénye.) Ezeket a jelenségeket már nem lehet az eddig ismertetett kétváltozós regressziós modellek segítségével modellezni, szükség van annak kiterjesztésére.

A többváltozós lineáris modell a következőképpen írható fel:

A fenti egyenleteket mátrixos alakban így írhatjuk:

6.4.1 Regressziós paraméterek meghatározása

A paraméterek meghatározásához ismét a legkisebb négyzetek elvét használjuk.

A minimalizálandó függvény:

A paraméterek parciális deriváltjait nullával egyenlővé téve megkaphatjuk a normálegyenleteket.

A normálegyenleteket megoldva megkaphatóak a becsült paraméterértékek. Az pedig a szemlélet alapján adódik, hogy az így kapott stacionárius pont valóban minimum hely.

A számítások végrehajtását a háromváltozós modell esetére mutatjuk be:

Egyszerűsíthetjük a számításokat, ha a normálegyenletekben az eredeti változókat (X1, X2, Y) az átlagtól vett eltéréseikkel helyettesítjük:

A konstans tag becslése:

Az egyenlet paramétereinek értelmezése:

A becsült paraméter az Xj egységnyi változásának a hatását fejezi ki az Y eredményváltozóra, a többi magyarázó változó értékének változatlansága mellett. A együtthatókat parciális regressziós együtthatóknak nevezzük.

Mátrixos alak:

A fenti egyenleteket a lineáris algebrát felhasználva az alábbi módon is felírhatjuk fel. Ekkor a regressziós modell:

Most a regressziós együtthatóvektor a legkisebb négyeztek elve alapján kapható meg a következő összefüggésből:

feltéve, ha az inverz létezik[1].

A fenti kifejezés részletesen kifejtve így alakul:

Számunkra az m=2 speciális eset a gyakorlat szempontjából különösen fontos, felírjuk explicite:

A mátrixinverznek a meghatározására bármelyik ismert mátrix-invertálási eljárás alkalmazható lenne, segítségül megadunk egy egyszerű mátrix-invertálási módszert.

Jelölje:

A bevezetett jelöléssel meghatározandó az alábbi mátrix inverze:

Vezessük be az alábbi jelöléseket:

Ekkor a mátrix inverze az alábbi módon számolható:

Ezek után az ismeretlen paraméterek meghatározhatók.

Bármely módszerrel meghatározva a paraméterek értékét, azok jelentése ugyanaz marad. Vagyis paraméter azt fogja megmutatni, hogy amennyiben a k-dik magyarázó változó ( ) egységnyivel növekszik, miközben az összes többi változó értéke változatlan marad[2], mennyivel nő/csökken az eredményváltozó értéke.

6.4.2 A paraméterek standard hibái

A többváltozós modellnél is van lehetőség meghatározni, hogy a sokasági paraméterek értéke ismételt mintavétel esetén az esetek százalékában milyen tartományba esne. Ehhez ismerni kell a k-dik paraméter standard hibáját:

Ekkor a keresett konfidencia intervallumok:

Az intervallum meghatározása a kétváltozós esettel analóg, azzal a különbséggel, hogy a t-eloszlás szabadságfoka n-m-1, azaz a magyarázóváltozók függvénye[3].

A paraméterek tesztelése

A szignifikancia ellenőrzése itt is elengedhetetlen a becslések megkezdése előtt. Mint ahogyan a kétváltozós esetnél, itt is van mód a paraméterek tesztelése mellett a modell jóságának tesztelésére.

Paraméterek tesztelésekor a null hipotézis általános formája:

Az ellenhipotézis ennek tagadásából áll, és azt jelenti, hogy igenis van összefüggés a k-adik magyarázóváltozó és az eredményváltozó között.

A kiszámítandó próbastatisztika:

,

a kritikus értékhez meghatározandó t értéknél a szabadságfok n-m-1.

Az alaphipotézis elfogadása most is akkor történik meg, ha a számított t értéke az elfogadási tartományban van, s ez azt jelenti, hogy a modell nem megfelelő.



[1] Egy mátrix inverze akkor létezik, ha az (m+1)*(m+1)-es mátrix rangja (m+1).

[2] Ezt a feltételt cp, azaz ceteris paribus feltételnek szokták hívni.

[3] A kétváltozós esetnél a magyarázóváltozók száma 1, azaz a szabadságfoka n-1-1=n-2 lesz.