Ugrás a tartalomhoz

Regressziós modellek az egészségpolitikai tervezésben példatár; Regressziós modellek az egészségpolitikai tervezésben példatár

Vokó Zoltán, Kabos Sándor, Lőw András

ELTE

4. fejezet - Fix és random tényezős regressziós modellek

4. fejezet - Fix és random tényezős regressziós modellek

Adatelemzési példák

Ebben a fejezetben az Európai Lakossági Egészségfelmérés (ELEF 2009) adatai kerülnek elemzésre.

Az ELEF2009 az első egységes európai kérdőíves egészségfelmérés volt, amelyet azonos módszertannal hajtottak végre az EU tagállamaiban. Az adatfelvételre 2009 őszén került sor. A magyarországi mintába 449 település került beválasztásra a kétlépcsős mintavételezés keretében. A tervezett 7000 fő közül 5051 esetében sikerült felvenni a kérdőíveket. A felmérés az egészségi állapotra (betegségek, balesetek, korlátozottság, munkahelyi körülmények, lelki és érzelmi állapot), az egészségmagatartás (testmozgás, táplálkozás, dohányzás, alkoholfogyasztás, kábítószer-fogyasztás), az egészségügyi ellátás igénybevételére, a lakossági egészségügyi kiadásokra, valamint a társadalmi-gazdasági tényezőkre terjedt ki (nem, kor, családi állapot, iskolázottság, munkaerőpiaci státusz, jövedelmi viszonyok).

Bemenő adatok:

  • vélt egészség rossz vagy nagyon rossz,

  • életkor (5-éves korcsoport),

  • nem,

  • a lakhely lakóövezeti jellege,

  • a lakhely melyik régióban van.

4.1. példa - Logisztikus regresszió, vélt egészség korcsoport, nem, régió szerint

változó

Esélyhányados

Együttható log(esélyhányados)

Együttható standard hibája

z-érték

Pr(>|z|)

(Intercept)

0,00998

-4,60722

0,25604

-17,99394

0

AGE.15-17

0,89044

-0,11603

0,75894

-0,15289

0,87849

AGE.35-64

11,64057

2,4545

0,24302

10,09979

0

AGE.65-X

33,99391

3,52618

0,24892

14,16566

0

GENDER.F

1,30472

0,26599

0,09671

2,7505

0,00595

REGIO.Közép-Dunántúl

0,95794

-0,04297

0,18227

-0,23573

0,81364

REGIO.Észak- Dunántúl

0,72521

-0,3213

0,19986

-1,60763

0,10792

REGIO.Dél- Dunántúl

1,34135

0,29367

0,17562

1,67224

0,09448

REGIO.Észak-Magyarország

1,89074

0,63697

0,15427

4,12886

4,00E-005

REGIO.Észak-Alföld

1,61119

0,47697

0,15057

3,16784

0,00154

REGIO.Dél-Alföld

1,5158

0,41595

0,1561

2,66461

0,00771

AGE ref.level: .18-34

GENDER reg.level: .MALE

REGIO ref.level: .Közép-Magyarország

Goodness of fit signif = 0.9948

(resid deviance = 350.3 , resid df = 421)

változó

Esély

Együttható log(esély)

Együttható standard hibája

z-érték

Pr(>|z|)

(Intercept)

0,00998

-4,60722

0,25604

-17,99394

0

A paraméterbecslések interpretációja előtt megállapítjuk, hogy a modell illeszkedik. A tengelymetszet (intercept) becslés azt mutatja, hogy a rossz vagy nagyon rossz egészségállapot önbesorolás szerinti esélye a referencia (18-34 éves Közép-Magyarországon lakó férfiak) csoportban 0,00998 , azaz a gyakorisága 1% körüli*. Ez természetesen nem tényadat, hanem a modell szerinti becslés. Az idősebb korosztályokban a rossz vagy nagyon rossz egészségi állapotban lévők aránya növekszik. A paraméterbecslések és azok szignifikanciája alapján látjuk a nem és a lakhely régió szerinti területi besorolásának hatását. Az itt alkalmazott eljárás a logisztikus-binomiális regresszió kategoriális magyarázó változókkal, a statisztikai modell leírása a 4.2.1. pontban.

* Mert p = esély / (1+esély). Kis esély esetén egy kimenetel esély és a valószínűsége közel azonos értékű, hiszen a 1+esély ≈ 1


4.2. példa - Poisson regresszió, vélt egészség korcsoport, nem, régió szerint

változó

Esélyhányados

Együttható log(esélyhányados)

Együttható standard hibája

z-érték

Pr(>|z|)

(Intercept)

0,01079

-4,52948

0,24944

-18,15887

0

AGE.15-17

0,89632

-0,10946

0,75347

-0,14527

0,8845

AGE.35-64

9,98736

2,30132

0,23998

9,58947

0

AGE.65-

22,55744

3,11606

0,24244

12,85282

0

GENDER.F

1,23151

0,20824

0,08554

2,43438

0,01492

REGIO.Közép-Dunántúl

0,96479

-0,03584

0,16502

-0,21719

0,82806

REGIO.Észak- Dunántúl

0,76399

-0,2692

0,18377

-1,46483

0,14297

REGIO.Dél- Dunántúl

1,26202

0,23271

0,15522

1,49924

0,13381

REGIO.Észak-Magyarország

1,62666

0,48653

0,13332

3,64935

0,00026

REGIO.Észak-Alföld

1,45181

0,37281

0,13229

2,81805

0,00483

REGIO.Dél-Alföld

1,38636

0,32668

0,13732

2,37891

0,01736


AGE ref.level: .18-34

GENDER ref.level: .MALE

REGIO ref.level: .Közép-Magyarország

Goodness of fit signif = 1

(resid deviance = 284.68 , resid df = 421 )

A Poisson regressziós modell ugyanolyan jól illeszkedik, mint az előző pontban bemutatott logisztikus-binomiális modell, és az egyes együtthatók szignifikancia szintje alapján levonható következtetések is azonosak. A két modell összehasonlítását a 4.2.1. pontban tárgyaljuk.

4.3. példa - Logisztikus regresszió, kevert modell. Vélt egészség a korcsoport, nem fix magyarázó és a régió random magyarázó változó szerint

fix rész

változó

Esélyhányados

Együttható log(esélyhányados)

Együttható standard hibája

z-érték

Pr(>|z|)

(Intercept)

0,02393

-3,73258

0,3121

-11,95966

0

AGE.15-17

0,22825

-1,47732

0,85841

-1,721

0,08598

AGE.35-64

7,23291

1,97864

0,28092

7,04356

0

AGE.65-

16,37372

2,79568

0,28022

9,97673

0

GENDER.F

1,25025

0,22335

0,15164

1,47283

0,14154

random rész

változó

Esélyhányados

Együttható log(esélyhányados)

Együttható standard hibája

.Közép-Magyarország

0,8285

-0,18813

0,22593

.Közép-Dunántúl

0,6529

-0,42632

0,24426

.Észak-Dunántúl

0,6674

-0,40437

0,23814

.Dél-Dunántúl

0,9539

-0,04723

0,22634

.Észak-Magyarország

1,3366

0,29016

0,2229

.Észak-Alföld

1,4336

0,3602

0,21232

.Dél-Alföld

1,5154

0,41569

0,21398


AGE ref.level: .18-34

GENDER reg.level: .MALE

Goodness of fit signif = 1

(pseudo resid deviance = 207.3 , resid df = 422)

A kevert (fix és random tényezőket tartalmazó) modell választásánál az alkalmazás számára az leggyakoribb szempont, hogy az egyéni szinten mért változóknak (itt: korcsoport és nem) és a kontextuális változóknak (itt: régió) kimenettel való kapcsolatát eltérő módon modellezhessük . Akkor használunk random tényezős modellt, amikor azt gondoljuk, hogy a kontextuális változók hatása nem közvetlen. A megkérdezettek az adott régió különböző településein laknak, és az, hogy a település melyik régióban van, az a település egyénre gyakorolt hatásának csak az egyik komponense. A kevert modellben a „random rész” által meghatározott valószínűségi modellben tudjuk ezt a hatást figyelmbe venni. A statisztikai specifikációt lásd a 4.2.2. pontban.

4.4. példa - Poisson regresszió, fix modell. Vélt egészség korcsoport, nem, lakóövezeti jelleg szerint

változó

Esélyhányados

Együttható log(esélyhányados)

Együttható standard hibája

z-érték

Pr(>|z|)

(Intercept)

0,00835

-4,78525

0,28061

-17,05286

0

AGE.15-17

0,83435

-0,1811

0,75434

-0,24007

0,81027

AGE.35-64

10,09824

2,31236

0,24005

9,63295

0

AGE.65-X

22,82483

3,12785

0,24266

12,88997

0

GENDER.F

1,23011

0,20711

0,08559

2,41986

0,01553

LAKOOV.lakótelep

1,561

0,44532

0,1862

2,39159

0,01678

LAKOOV.kertes városias

1,27807

0,24535

0,16714

1,46791

0,14213

LAKOOV.falusias

2,14494

0,76311

0,16934

4,50647

1,00E-005

LAKOOV.külterület

1,68057

0,51913

0,3121

1,66335

0,09624

LAKOOV.szoc.nem.megf

3,91291

1,36428

0,37433

3,64457

0,00027


AGE ref.level: .18-34

GENDER ref.level: .MALE

LAKOOV ref.level: .városias

Goodness of fit signif = 1

(resid deviance = 272,47 , resid df = 422)

4.5. példa - Poisson regresszió, kevert modell. Vélt egészség a korcsoport, nem fix magyarázó és a lakóövezeti jelleg random magyarázó változó szerint

fix rész

változó

változó

Esélyhányados

Együttható log(esélyhányados)

Együttható standard hibája

z-érték

Pr(>|z|)

(Intercept)

(Intercept)

0,01412

-4,2602

0,25647

-16,61059

0

AGE.15-17

AGE.15-17

0,85655

-0,15484

0,60607

-0,25549

0,79847

AGE.35-64

AGE.35-64

10,06303

2,30887

0,19295

11,96624

0

AGE.65-X

AGE.65-X

22,67061

3,12107

0,19499

16,00636

0

GENDER.F

GENDER.F

1,22967

0,20675

0,0688

3,00518

0,00281

random rész

változó

Esélyhányados

Együttható log(esélyhányados)

Együttható standard hibája

.városias

0,6249

-0,47015

0,19769

.lakótelep

0,9366

-0,06553

0,18699

.kertes városias

0,7683

-0,26362

0,18001

.falusias

1,2766

0,24421

0,18088

.külterület

1,0041

0,00406

0,23446

.szoc.nem.megf

1,735

0,55103

0,26916

AGE ref.level: .18-34

GENDER reg.level: .MALE

Goodness of fit signif = 1

(pseudo resid deviance = 332.8 , resid df = 423)

változó

A kevert modellből számított esélyhányados

A kevert modellből transzformált esélyhányados

A fix modellből számított esélyhányados

.városias

0,6249

1

1

.lakótelep

0,9366

1,4987

1,561

.kertes városias

0,7683

1,2294

1,27807

.falusias

1,2766

2,0428

2,14494

.külterület

1,0041

1,6067

1,68057

.szoc.nem.megf

1,735

2,7764

3,91291


A fenti táblázat összehasonlítja a 4.14. és a 4.1.5 modellekben lakóövezeti jelleg szerinti csoportokra számolt esélyhányadosokat. Az összehasonlításhoz azt a transzformációt hajtottuk végre, hogy a kevert modell „városias” esélyhányadosával osztottuk a kevert modell esélyhányadosait, mert a fix modellben a „városias” kategória volt a referencia.

Azt látjuk, hogy a kevert modellben kisebb az eltérés az egyes kategóriák között, különösen a „szoc.nem.megfelelő” kategória került közelebb a többihez.