Németh Renáta, Simon Dávid
ELTE
Bevezető definíció:
Két magas mérési szintű változó közötti kapcsolat lineáris, ha a független változó egységnyi emelése mellett a függő változó várható értéke minden esetben azonos mértékben és irányban változik.
Két magas mérési szintű változó kapcsolata jellemezhető azzal az egyenessel (és annak tulajdonságaival), amelyre az adatok illeszkednek (ha ilyen egyenes létezik).
Illesszünk egyenest a fenti ábrába!
Az illesztett egyenest (az illesztés módjával az óra későbbi részében foglalkozunk) két paraméterrel jellemezhetjük:
a meredekséggel
és az y tengely metszéspontjával
Az egyenes egyenlete általános esetben (emlékeztetőül a középiskolai matematika órák nyomán):
y=a+bx
ahol
a az a pont, ahol az egyenes metszi az y tengelyt (y értéke, amikor x=0) (intercept)
b az egyenes meredeksége, azaz egységenkénti emelkedése (ha az x tengelyen 1-et lépünk jobbra hányat kell lépni az y-on)
Mit jelenthet a meredekség?
Az egyenes meredéksége jellemzi az összefüggés irányát és mértékét:
negatív meredekség: fordított irányú összefüggés (minél nagyobb a független változó értéke, annál kisebb a függőé)
pozitív meredekség: egyenes irányú összefüggés
zérus meredekség: függetlenség
a meredekség abszolút értéke jellemzi a hatás erősségét
Nézzük meg a következő két ábrát és a hozzájuk tartozó egyenesek egyenletét!
A két ábrán az látjuk, hogy noha azonos adatokat használtunk, változott az összefüggés erősségét jelző b érték. Az egyetlen különbség a mértékegységben volt. Fontos tanulság, hogy a b értéke függ a felhasznált változók (mindkettő) mértékegységétől.
Ezért, ha több különböző adatforrást (például több országban elvégzett azonos kutatást) felhasználva hasonlítanánk össze az összefüggés erősségét, akkor ehhez figyelembe kell vegyük a mértékegységet. Ugyancsak így kell eljárjunk, ha több külöböző független változó hatását akarjuk összehasonlítani egy adott függő változóra (például arra vagyunk kíváncsiak, hogy a jövedelemet inkább az életkor vagy az elvégzett iskolai évek száma befolyásolja).
Itt nem részletezett módon (de egy kis gondolkodás után beláthatóan) a b értéke hasonlóan függ a szórás mértékétől is. A valódi megoldást a változók strandardizálása jelentheti (erről a következő fejezetben lesz szó).
Alapvetően könnyen beláthatjuk, hogy ha a független változó értéke nulla lenne, akkor ennyi lenne a függőváltozó értéke.
Vajon van-e ennek valódi (társadalomtudományi) jelentése? Ez attól függ, hogy milyen változókról van szó. Az életkor és jövedelem kapcsolatának vizsgálatakor az intercept nem értelmezhető, mert – elméleti ismereteink és mindennapi tudásunk alapján – tudjuk, hogy 0 éves életkorra semmilyen jellemző személyes jövedelem nem adható meg. A későbbiekben találkozunk olyan példával, ahol az intercept értéke értelmezhető.
Ismétlésként: Mit mondhatunk el az életkor és a jövedelem kapcsolatáról az eddigi ismeretek birtokában?