Ugrás a tartalomhoz

Regressziós modellek az egészségpolitikai tervezésben példatár; Regressziós modellek az egészségpolitikai tervezésben példatár

Vokó Zoltán, Kabos Sándor, Lőw András

ELTE

3. fejezet - Regressziós modellek folytonos és kategoriális magyarázó változókkal

3. fejezet - Regressziós modellek folytonos és kategoriális magyarázó változókkal

Adatelemzési példák

Ebben a fejezetben Vas megyei mortalitási adatokat elemzünk.

  • teljes halálozás településenként, életkor (5-éves korcsoport) és nem szerinti bontásban

  • lakónépesség (ugyanilyen bontásban)

  • környezeti változók településenként

  • lakosságszám (LSZKOD), a település mentőállomástól való távolsága (mento), munkanélküliek aránya (munkanelkarany), középiskola legmagasabb végzettséggel rendelkezők aránya (kozepisk), felsőfokú végzettségűek aránya (felsofoku).

Az alkalmazott regressziós eljárások statisztikai hátterének összefoglalása a 2.2. és a 3.2. fejezetekben.

3.1. példa - Poisson regresszió, mortalitás korcsoportok szerint

Változó

Incidencia sűrűség hányados (ISH)

Együttható

Az együttható standard hibája

z –érték

Pr(>|z|)

(Intercept)

0,00071

-7,2502

0,32455

-22,3392

0

AGE.00-00

3,45294

1,23922

0,37321

3,32045

0,0009

AGE.01-04

0,37085

-0,99195

0,64734

-1,53235

0,12544

AGE.05-09

0,19086

-1,6562

0,82802

-2,00018

0,04548

AGE.10-14

0,35258

-1,04249

0,62106

-1,67857

0,09324

AGE.15-19

0,55239

-0,5935

0,48945

-1,2126

0,22528

AGE.25-29

1,31103

0,27081

0,40089

0,67553

0,49934

AGE.30-34

2,10434

0,744

0,37013

2,01011

0,04442

AGE.35-39

3,43103

1,23286

0,33577

3,67174

0,00024

AGE.40-44

7,82675

2,05755

0,3102

6,63304

0

AGE.45-49

14,90628

2,70178

0,30362

8,89848

0

AGE.50-54

22,84387

3,12868

0,30127

10,38491

0

AGE.55-59

30,3301

3,41214

0,30022

11,36544

0

AGE.60-64

40,05764

3,69032

0,29893

12,34507

0

AGE.65-69

57,16813

4,046

0,2975

13,59979

0

AGE.70-74

103,54153

4,63997

0,29611

15,66984

0

AGE.75-79

260,15598

5,56128

0,29553

18,81826

0

AGE.80-84

280,80722

5,63767

0,29637

19,02216

0

AGE.85-X

505,2024

6,22496

0,29545

21,06971

0


AGE ref.level: .20-24

Egyetlen magyarázó változó van: az életkor (kategóriák 5-éves korcsoportonként).

α : a táblázat (Tengelymetszet) sorában írt becslés

β: pl. a táblázat (AGE.50-54) sorában az 50-54 korcsoportra vonatkozó együttható becslése.

A táblázat oszlopainak jelentése

első oszlop: a változó megnevezése,

második oszlop: az együttható becslése, exponenciálisa az incidencia sűrűség (arányszám hányados), amely a hozzátartozó változó egységnyi változásához tartozik. Jelen esetben az X-ek indikátor változók, értékük 1 az adott korcsoportban, egyébként 0.

harmadik oszlop: incidencia sűrűség (arányszám) hányados

negyedik oszlop: a becslés standard hibája ,

az ötödik oszlop: a számított Wald-féle z-statisztika értéke

hatodik oszlop: az együttható számított szignifikanciaszintje.

A referencia csoport a 20-24 évesek, körükben a mortalitás=exp(α)=exp(-7,51595)= 0,00054 azaz 5,4 per 10000 személy-év. Az 50-54 éves korosztályban a mortalitás ehhez képest exp(beta)=exp(3,12868)=22,84-szeres.

3.2. példa - Poisson regresszió, mortalitás a korcsoport, nem szerint

Változó

Incidencia sűrűség hányados (ISH)

Együttható

Az együttható standard hibája

z –érték

Pr(>|z|)

(Intercept)

0,00068

-7,2915

0,29301

-24,8845

0

AGE.00-00

3,45429

1,23962

0,37321

3,3215

9,00E-004

AGE.01-04

0,37202

-0,98881

0,64734

-1,52749

0,12664

AGE.05-09

0,19096

-1,65571

0,82801

-1,99963

0,04554

AGE.10-14

0,35388

-1,03879

0,62106

-1,67261

0,0944

AGE.15-19

0,55385

-0,59085

0,48945

-1,20718

0,22736

AGE.25-29

1,3131

0,27239

0,40089

0,67946

0,49685

AGE.30-34

2,10691

0,74522

0,37013

2,01341

0,04407

AGE.35-39

3,45253

1,23911

0,33577

3,69035

0,00022

AGE.40-44

7,87562

2,06377

0,3102

6,6531

0

AGE.45-49

15,01495

2,70905

0,30362

8,9224

0

AGE.50-54

23,3062

3,14872

0,30127

10,45134

0

AGE.55-59

31,48157

3,4494

0,30023

11,48923

0

AGE.60-64

42,24041

3,74338

0,29895

12,52183

0

AGE.65-69

61,28111

4,11547

0,29754

13,83188

0

AGE.70-74

112,7548

4,72522

0,29616

15,95518

0

AGE.75-79

287,93925

5,66275

0,29559

19,15719

0

AGE.80-84

318,76084

5,76444

0,29648

19,44276

0

AGE.85-X

509,1224

6,23269

0,29545

21,09585

0

GENDER.F

0,58561

-0,53511

0,0336

-15,92586

0


AGE ref.level: .20-24

GENDER ref.level: .MALE

3.3. példa - Poisson regresszió, mortalitás a korcsoport, nem és a lakhely település környezeti változói szerint

Változó

Incidencia sűrűség hányados (ISH)

Együttható

Az együttható standard hibája

z -érték

Pr(>|z|)

(Intercept)

0,00122

-6,70968

0,35556

-18,87095

0

AGE.00-00

3,11553

1,1364

0,37166

3,05763

0,00223

AGE.01-04

0,42709

-0,85076

0,59933

-1,41952

0,15575

AGE.05-09

0,22017

-1,51333

0,76365

-1,98172

0,04751

AGE.10-14

0,33879

-1,08237

0,60749

-1,78169

0,0748

AGE.15-19

0,55029

-0,59731

0,47832

-1,24876

0,21175

AGE.25-29

1,35989

0,3074

0,3934

0,7814

0,43457

AGE.30-34

2,11189

0,74758

0,36308

2,05903

0,03949

AGE.35-39

3,34322

1,20694

0,33025

3,65465

0,00026

AGE.40-44

7,89268

2,06594

0,30582

6,75538

0

AGE.45-49

14,65945

2,68509

0,29971

8,95887

0

AGE.50-54

22,29776

3,10449

0,29747

10,43637

0

AGE.55-59

31,00256

3,43407

0,29624

11,59209

0

AGE.60-64

41,79252

3,73272

0,29484

12,65999

0

AGE.65-69

62,85608

4,14085

0,29338

14,11437

0

AGE.70-74

124,779

4,82654

0,29203

16,52779

0

AGE.75-79

274,12125

5,61357

0,2917

19,24414

0

AGE.80-84

339,13257

5,82639

0,29231

19,93216

0

AGE.85-X

744,27166

6,61241

0,29294

22,5729

0

GENDER.F

0,59625

-0,5171

0,04428

-11,67897

0

kozepiskola

0,98951

-0,01055

0,00551

-1,91588

0,05538

felsofoku

1,00789

0,00786

0,01057

0,74334

0,45727

munkanelkarany

0,98499

-0,01512

0,00733

-2,0623

0,03918

LSZKOD. 5000+

0,91834

-0,08519

0,07832

-1,08769

0,27673

LSZKOD. 3-5000

0,74271

-0,29745

0,12796

-2,32451

0,0201

LSZKOD. 1-3000

0,70274

-0,35276

0,12734

-2,77023

0,0056

LSZKOD. 500-1000

0,61445

-0,48703

0,14116

-3,45024

0,00056

LSZKOD. -500

0,34544

-1,06294

0,15225

-6,98165

0

mento

1,0031

0,00309

0,00196

1,5768

0,11484


AGE ref.level: .20-24

GENDER ref.level: .MALE

LSZKOD ref.level= .MEGYESZÉKHELY

Itt kategoriális magyarázó változók (GENDER, AGE, LSZKOD) mellett szám-értékű változók is megjelentek (kozepiskola, felsofoku, munkanelkarany, mento), ezt a modellt 3.2.1. írja le.

3.4. példa - A modellek illeszkedésének mérőszáma

3.1.1. modell: (resid deviance = 4602,84 , resid df = 8189 )

3.1.2. modell: (resid deviance = 4349,36 , resid df = 8188 )

3.1.3. modell: (resid deviance = 3753,85 , resid df = 8179 )

A 2.2. fejezetben elmondottak alapján megállapíthatjuk, hogy ezek a modellek mind illeszkednek, ezért az egyes tényezőkre vonatkozó becsléseket, azok szignifikanciáját érvényesnek tekintjük. Az érvényesség a modellen belül értendő, mivel ha változtatunk azon, hogy mely magyarázó változókat vesszük be a modellbe, az természetesen a becsléseket is megváltoztatja.

Megfigyelhetjük, hogy az 3.1.2. táblázat becslései megváltoztak az 3.1.1. táblázatéhoz képest (mármint azok, melyek ott is szerepeltek), hasonlóan az 3.1.3. táblázat becslései az 3.1.2. táblázatéhoz képest.


3.5. példa - Poisson regresszió, mortalitás a lakhely település környezeti változói szerint, nem és korcsoport figyelembevétele nélkül

Változó

Incidencia sűrűség hányados (ISH)

Együttható

Az együttható standard hibája

z -érték

Pr(>|z|)

(Intercept)

0,04134

-3,18602

0,21401

-14,88734

0

kozepiskola

0,96725

-0,03329

0,005

-6,65278

0

felsofoku

1,02766

0,02728

0,00798

3,41889

0,00063

munkanelkarany

0,97737

-0,02289

0,00766

-2,98876

0,0028

LSZKOD. 5000+

0,68222

-0,38241

0,07857

-4,8672

0

LSZKOD. 3-5000

0,49321

-0,70683

0,12971

-5,44912

0

LSZKOD. 1-3000

0,53013

-0,63463

0,12921

-4,91166

0

LSZKOD. 500-1000

0,67018

-0,40021

0,14163

-2,82578

0,00472

LSZKOD. -500

0,56793

-0,56576

0,15222

-3,71661

2,00E-004

mento

1,00642

0,0064

0,00198

3,23741

0,00121


LSZKOD ref.level= .MEGYESZÉKHELY

3.1.4.modell: (resid deviance = 14878,4 , resid df = 8198 )

Ezért ez a modell nem illeszkedik.

3.6. példa - Poisson regresszió, mortalitás a lakhely település környezeti változói szerint, nemre és korcsoportra standardizálva

Változó

Incidencia sűrűség hányados (ISH)

Együttható

Az együttható standard hibája

z -érték

Pr(>|z|)

(Intercept)

0,04109

-3,19197

0,20983

-15,21182

0

kozepiskola

0,98552

-0,01458

0,0049

-2,97373

0,00294

felsofoku

0,97107

-0,02935

0,00806

-3,64242

0,00027

munkanelkarany

0,97953

-0,02068

0,00753

-2,7449

0,00605

LSZKOD. 5000+

0,63739

-0,45037

0,07842

-5,74307

0

LSZKOD. 3-5000

0,46398

-0,76791

0,12801

-5,99893

0

LSZKOD. 1-3000

0,49395

-0,70533

0,12744

-5,53445

0

LSZKOD. 500-1000

0,58338

-0,53892

0,1399

-3,85207

0,00012

LSZKOD. -500

0,51553

-0,66257

0,15005

-4,41564

1,00E-005

mento

1,00766

0,00763

0,00194

3,92591

9,00E-005


LSZKOD ref.level= .MEGYESZÉKHELY

3.1.5.modell: (resid deviance = 4036,98 , resid df = 8198 )

A standardizálás műveletét a 3.2.2. fejezet írja le. A technikai megvalósítás az, hogy a kor és nem szerinti kategóriákban vett országos mortalitás érték és a népességszám szorzatát (pontosabban a szorzat logaritmusát) alkalmazzuk offset változóként.

Az interpretáció számára a lényeges az, hogy a standardizálással készült táblázatban az ISH értékek azt mutatják, hogy az egyes kategóriákban hogyan aránylik a Vas megyei mortalitás az országos átlag (ugyanilyen kategóriájában vett) mortalitás értékéhez.

Mint látjuk, ugyanazok a magyarázó változók a legutóbbi két példában. A standardizálás nélküli 3.1.4. modell nem illeszkedett, a standardizálással készült 3.1.5. modell igen.

3.7. példa - Poisson regresszió, mortalitás a korcsoport és a lakhely település környezeti változói szerint, nemre és korcsoportra standardizálva

Változó

Incidencia sűrűség hányados (ISH)

Együttható

Az együttható standard hibája

z -érték

Pr(>|z|)

(Intercept)

0,02659

-3,62712

0,35723

-10,15354

0

AGE.00-00

0,22123

-1,50854

0,3717

-4,05849

5,00E-005

AGE.01-04

0,68612

-0,37671

0,59935

-0,62852

0,52966

AGE.05-09

0,75215

-0,28482

0,76373

-0,37294

0,70919

AGE.10-14

1,01544

0,01532

0,60751

0,02522

0,97988

AGE.15-19

0,80295

-0,21946

0,47832

-0,45882

0,64636

AGE.25-29

1,05624

0,05471

0,3934

0,13907

0,88939

AGE.30-34

0,97681

-0,02347

0,36308

-0,06463

0,94847

AGE.35-39

0,77735

-0,25187

0,33025

-0,76266

0,44566

AGE.40-44

0,96743

-0,03311

0,30582

-0,10826

0,91379

AGE.45-49

1,19191

0,17556

0,29971

0,58576

0,55804

AGE.50-54

1,27781

0,24515

0,29747

0,82411

0,40988

AGE.55-59

1,29933

0,26185

0,29624

0,8839

0,37675

AGE.60-64

1,23469

0,21082

0,29484

0,71503

0,47459

AGE.65-69

1,28403

0,25

0,29338

0,85213

0,39414

AGE.70-74

1,67405

0,51524

0,29205

1,76426

0,07769

AGE.75-79

2,33802

0,8493

0,29174

2,91114

0,0036

AGE.80-84

1,78617

0,58007

0,29238

1,98401

0,04726

AGE.85-X

2,23482

0,80416

0,29289

2,74559

0,00604

kozepiskola

0,98137

-0,01881

0,00494

-3,80464

0,00014

felsofoku

0,98752

-0,01256

0,00817

-1,53734

0,12421

munkanelkarany

0,97932

-0,02089

0,00751

-2,78341

0,00538

LSZKOD. 5000+

0,68046

-0,38499

0,07853

-4,90236

0

LSZKOD. 3-5000

0,49377

-0,70569

0,12831

-5,49989

0

LSZKOD. 1-3000

0,50577

-0,68167

0,12821

-5,31706

0

LSZKOD. 500-1000

0,55783

-0,58369

0,14131

-4,13065

4,00E-005

LSZKOD. -500

0,44997

-0,79859

0,15301

-5,21907

0

mento

1,00708

0,00705

0,00195

3,62273

0,00029


3.1.6.modell: (resid deviance = 3621,65 , resid df = 8180 )

AGE ref.level: .20-24

GENDER ref.level: .MALE

LSZKOD ref.level= .MEGYESZÉKHELY

3.8. példa - Poisson regresszió, mortalitás a korcsoport, nem és a lakhely település környezeti változói szerint, nemre és korcsoportra standardizálva

Változó

Incidencia sűrűség hányados (ISH)

Együttható

Az együttható standard hibája

z -érték

Pr(>|z|)

(Intercept)

0,0265

-3,63054

0,35748

-10,15606

0

AGE.00-00

0,22097

-1,50972

0,37172

-4,06139

5,00E-005

AGE.01-04

0,68544

-0,3777

0,59936

-0,63017

0,52858

AGE.05-09

0,75139

-0,28583

0,76374

-0,37425

0,70822

AGE.10-14

1,01467

0,01456

0,60751

0,02397

0,98088

AGE.15-19

0,80268

-0,2198

0,47832

-0,45951

0,64586

AGE.25-29

1,05621

0,05469

0,3934

0,13902

0,88944

AGE.30-34

0,97687

-0,0234

0,36308

-0,06445

0,94861

AGE.35-39

0,77731

-0,25191

0,33025

-0,76279

0,44559

AGE.40-44

0,96742

-0,03313

0,30582

-0,10832

0,91374

AGE.45-49

1,1918

0,17547

0,29971

0,58545

0,55825

AGE.50-54

1,27754

0,24494

0,29747

0,82341

0,41027

AGE.55-59

1,29882

0,26145

0,29625

0,88255

0,37748

AGE.60-64

1,23396

0,21023

0,29485

0,71301

0,47584

AGE.65-69

1,28282

0,24906

0,2934

0,84887

0,39595

AGE.70-74

1,67175

0,51387

0,29209

1,7593

0,07853

AGE.75-79

2,33349

0,84737

0,29183

2,90365

0,00369

AGE.80-84

1,78169

0,57756

0,29252

1,97445

0,04833

AGE.85-X

2,23189

0,80285

0,29293

2,74072

0,00613

GENDER.F

1,01226

0,01218

0,04443

0,2742

0,78393

kozepiskola

0,98071

-0,01948

0,00552

-3,52954

0,00042

felsofoku

0,98937

-0,01068

0,01066

-1,00236

0,31617

munkanelkarany

0,97928

-0,02094

0,00751

-2,78965

0,00528

LSZKOD. 5000+

0,68284

-0,38149

0,07955

-4,79573

0

LSZKOD. 3-5000

0,49547

-0,70224

0,12893

-5,44685

0

LSZKOD. 1-3000

0,50769

-0,67789

0,12896

-5,2564

0

LSZKOD. 500-1000

0,56017

-0,57951

0,14215

-4,07669

5,00E-005

LSZKOD. -500

0,45167

-0,79481

0,15366

-5,17245

0

mento

1,00704

0,00702

0,00195

3,59897

0,00032


AGE ref.level: .20-24

GENDER ref.level: .MALE

LSZKOD ref.level= .MEGYESZÉKHELY

3.1.7.modell: (resid deviance = 3621,58 , resid df = 8179)

Az értelmezésben fontos a standardizálás figyelembevétele, tehát pl. itt az AGE együtthatók a hasonló korosztályos országos adatokhoz viszonyítják a vasi adatokat. Látható, hogy az együtthatók általában nem szignifikánsak, kivéve a 75+ korosztályokat, ahol a Vasi mortalitás jelentősen meghaladja az országos átlagot.

Emlékszünk, hogy az 3.1.2. modellben megjelenő GENDER az 3.1.1. modell resid deviance értékét 250-nel javította, a standardizálás után ez a változó csak 0.07 javulást hozott. Ez azt jelenti, hogy a nemek közötti különbségek nagyjából az országos átlag szerint alakulnak Vas megyében. GENDER.F nagyobb, mint 1 és nem szignifikáns (a standardizálás előtt kisebb volt, mint 1, és szignifikáns). Ennek is az az oka, hogy a relatív incidencia sűrűség, amit számolunk, tehát mindig az azonos kategóriájú országos adatokhoz viszonyítunk.

3.9. példa - Poisson regresszió, mortalitás a korcsoport, nem és a lakhely település iskolai végzettség (kozepiskola, felsofoku) változói szerint, nemre és korcsoportra standardizálva

Változó

Incidencia sűrűség hányados (ISH)

Együttható

Az együttható standard hibája

z –érték

Pr(>|z|)

(Intercept)

0,01026

-4,57944

0,29233

-15,66512

0

AGE.00-00

0,22033

-1,51264

0,37172

-4,06926

5,00E-005

AGE.01-04

0,6816

-0,38331

0,59936

-0,63954

0,52247

AGE.05-09

0,74633

-0,29259

0,76365

-0,38315

0,70161

AGE.10-14

1,00861

0,00857

0,60751

0,01411

0,98874

AGE.15-19

0,80096

-0,22195

0,47832

-0,46401

0,64264

AGE.25-29

1,05496

0,0535

0,3934

0,136

0,89182

AGE.30-34

0,97401

-0,02633

0,36308

-0,07252

0,94219

AGE.35-39

0,77467

-0,25532

0,33025

-0,77312

0,43945

AGE.40-44

0,96576

-0,03484

0,30582

-0,11392

0,9093

AGE.45-49

1,19301

0,17648

0,29971

0,58883

0,55598

AGE.50-54

1,28144

0,24799

0,29747

0,83365

0,40448

AGE.55-59

1,30372

0,26522

0,29624

0,89529

0,37063

AGE.60-64

1,24009

0,21518

0,29485

0,72981

0,46551

AGE.65-69

1,29092

0,25536

0,2934

0,87035

0,38411

AGE.70-74

1,68605

0,52239

0,29208

1,78853

0,07369

AGE.75-79

2,3584

0,85798

0,29182

2,94013

0,00328

AGE.80-84

1,80165

0,5887

0,2925

2,01264

0,04415

AGE.85-X

2,22041

0,79769

0,29236

2,72848

0,00636

GENDER.F

1,04166

0,04081

0,04362

0,93575

0,3494

kozepiskola

0,9929

-0,00713

0,00423

-1,68638

0,09172

felsofoku

1,00341

0,00341

0,01

0,34102

0,73309


AGE ref.level: .20-24

GENDER ref.level: .MALE

3.1.8.modell: (resid deviance = 3999,5 , resid df = 8186 )

Ebben a modellben a középiskolát végzettek aránya gyengén (p=0.092) szignifikáns, és ahol nagyobb az értéke, ott kicsit kisebb a mortalitás. A felsőfokú végzettségűek arányának nincs kimutatható hatása.

3.10. példa - Poisson regresszió, mortalitás a korcsoport, nem és a lakhely település egyéb jellemzői (munkanelkarany, mento, LSZKOD) változója szerint, nemre és korcsoportra standardizálva

Változó

Incidencia sűrűség hányados (ISH)

Együttható

Az együttható standard hibája

z -érték

Pr(>|z|)

(Intercept)

0,0088

-4,73349

0,29205

-16,20756

0

AGE.00-00

0,22143

-1,50764

0,37172

-4,05582

5,00E-005

AGE.01-04

0,68583

-0,37712

0,59936

-0,6292

0,52922

AGE.05-09

0,75029

-0,28729

0,76373

-0,37617

0,70679

AGE.10-14

1,01237

0,0123

0,60751

0,02024

0,98385

AGE.15-19

0,80185

-0,22084

0,47832

-0,4617

0,6443

AGE.25-29

1,0572

0,05562

0,3934

0,14139

0,88756

AGE.30-34

0,97763

-0,02263

0,36308

-0,06232

0,95031

AGE.35-39

0,77742

-0,25178

0,33025

-0,76239

0,44582

AGE.40-44

0,96695

-0,0336

0,30582

-0,10988

0,9125

AGE.45-49

1,19237

0,17595

0,29971

0,58705

0,55717

AGE.50-54

1,28005

0,2469

0,29747

0,83001

0,40654

AGE.55-59

1,30467

0,26595

0,29624

0,89775

0,36932

AGE.60-64

1,24151

0,21633

0,29485

0,7337

0,46313

AGE.65-69

1,29156

0,25585

0,2934

0,87203

0,38319

AGE.70-74

1,68517

0,52186

0,29208

1,78672

0,07398

AGE.75-79

2,35188

0,85521

0,29182

2,93062

0,00338

AGE.80-84

1,79682

0,58602

0,29251

2,00342

0,04513

AGE.85-X

2,24872

0,81036

0,29293

2,76641

0,00567

GENDER.F

1,02644

0,0261

0,03393

0,76924

0,44175

munkanelkarany

0,99013

-0,00992

0,00718

-1,38206

0,16695

LSZKOD. 5000+

0,93663

-0,06547

0,05128

-1,27666

0,20172

LSZKOD. 3-5000

0,80782

-0,21342

0,09119

-2,34049

0,01926

LSZKOD. 1-3000

0,9224

-0,08077

0,06178

-1,3075

0,19104

LSZKOD. 500-1000

1,10263

0,09769

0,06343

1,54011

0,12353

LSZKOD. -500

0,93319

-0,06915

0,07123

-0,97074

0,33168

mento

1,00701

0,00699

0,00194

3,59826

0,00032


AGE ref.level: .20-24

GENDER ref.level: .MALE

LSZKOD ref.level= .MEGYESZÉKHELY

3.1.9.modell: (resid deviance = 3963,26 , resid df = 8181 )

Ebben a modellben a mentőállomástól való távolság hatása szignifikáns, ahol nagyobb a távolság ott magasabb a mortalitás. Ezen kívül az LSZKOD 3-5000 hatása szignifikáns.

Összefoglalva: a 3.1.4. példában minden környezeti változó parciális hatása szignifikáns (a felsőfokú végzettségűek aránya kivételével), de itt a modell nem illeszkedik. A 3.1.5. példa illeszkedő modell mellett kapjuk ugyanezt az eredményt, majd a 3.1.6. példában az AGE és a 3.1.7. példában a GENDER is magyarázó változó lett, és ez csökkentette a környezeti változók magyarázó erejét. Az igazán meglepő azonban a 3.1.8. és 3.1.9. példa, ahol még a környezeti változók egy-egy csoportját is kivettük a modellből, és ennek hatására a bent maradó változók hatása nem nőtt hanem csökkent.

A változószelekció a Poisson regressziónál nem végezhető a lineáris modellben megszokott parciális korreláción alapuló eljárásokkal, a modellben szereplő változók parciális hatását mutató szignifikancia értéket csak közelítésnek szabad tekinteni. A magyarázó változók szelekcióját az általánosított lineáris modell deviance statisztikáján alapuló módszerrel végezhetjük, erre szolgál az R bestglm csomagja (McLeod, A.I. – Xu, C.: Best Subset GLM package[bib_7]).

3.11. példa - BMA Bayes-féle modell átlagolási eljárás. Poisson regresszió, mortalitás a korcsoport, nem és a lakhely település egyéb jellemzői változója szerint, nemre és korcsoportra standardizálva.

változó

szint/részvételi arány

Együttható

Az együttható standard hibája

1.model

2.model

3.model

(Intercept)

100,00%

-5,5059

0,5635

-5,514

-5,329

-5,726

AGE

100,00%

0,3505

0,0153

0,3496

0,3524

0,3564

GENDER

100,00%

 

 

 

 

 

 

AGE.00-00

-0,1832

0,4321

-0,1841

-0,1942

-0,1541

 

AGE.01-04

-1,1685

0,8676

-1,171

-1,175

-1,125

 

AGE.05-09

-1,5123

1,1342

-1,516

-1,517

-1,465

 

AGE.10-14

-0,6795

0,7401

-0,6828

-0,6851

-0,634

 

AGE.15-19

-0,1821

0,5348

-0,1846

-0,1899

-0,1416

 

AGE.25-29

0,4581

0,4159

0,4562

0,4491

0,4951

 

AGE.30-34

0,5994

0,389

0,5978

0,5897

0,6335

 

AGE.35-39

0,9215

0,3499

0,9207

0,9103

0,9496

 

AGE.40-44

1,5672

0,3185

1,567

1,554

1,591

 

AGE.45-49

1,9115

0,3111

1,911

1,898

1,935

 

AGE.50-54

2,1589

0,3076

2,159

2,145

2,182

 

AGE.55-59

2,2371

0,3067

2,237

2,223

2,259

 

AGE.60-64

2,2853

0,3059

2,286

2,271

2,306

 

AGE.65-69

2,4398

0,3046

2,44

2,426

2,459

 

AGE.70-74

2,6509

0,3032

2,652

2,637

2,668

 

AGE.75-79

2,8538

0,302

2,854

2,84

2,875

 

AGE.80-84

2,4834

0,3049

2,483

2,47

2,507

 

AGE.85-X

2,5241

0,3051

2,525

2,516

2,529

felsofoku

92,80%

0,032

0,0126

0,0338

0,0388

-

kozepiskola

100,00%

0,0772

0,0056

0,0767

0,0736

0,0895

munkanelkarany

87,50%

0,023

0,011

0,026

-

0,0301

mento

100,00%

-0,0142

0,0021

-0,0145

-0,0123

-0,0149

AGE.GENDER..

100,00%

 

 

 

 

 

 

.AGE.01-04:GENDER.F

0,1938

1,2445

0,1936

0,194

0,1959

 

.AGE.05-09:GENDER.F

0,1788

1,6172

0,1787

0,1783

0,1807

 

.AGE.10-14:GENDER.F

-0,368

1,2386

-0,3683

-0,3675

-0,3652

 

.AGE.15-19:GENDER.F

-0,8524

1,0403

-0,8529

-0,8507

-0,8497

 

.AGE.25-29:GENDER.F

-1,396

0,9208

-1,397

-1,394

-1,391

 

.AGE.30-34:GENDER.F

-0,8707

0,7216

-0,8715

-0,8692

-0,8651

 

.AGE.35-39:GENDER.F

-0,721

0,6004

-0,7217

-0,7195

-0,7152

 

.AGE.40-44:GENDER.F

-0,6459

0,5201

-0,6466

-0,6435

-0,6415

 

.AGE.45-49:GENDER.F

-0,4664

0,4967

-0,4671

-0,464

-0,4634

 

.AGE.50-54:GENDER.F

-0,6451

0,4914

-0,6458

-0,6433

-0,641

 

.AGE.55-59:GENDER.F

-0,6121

0,4871

-0,6129

-0,6103

-0,6067

 

.AGE.60-64:GENDER.F

-0,4223

0,4815

-0,4228

-0,4214

-0,4177

 

.AGE.65-69:GENDER.F

-0,3533

0,4769

-0,3537

-0,3537

-0,3486

 

.AGE.70-74:GENDER.F

-0,1274

0,4726

-0,1276

-0,1284

-0,1225

 

.AGE.75-79:GENDER.F

0,0839

0,4711

0,0839

0,0832

0,0862

 

.AGE.80-84:GENDER.F

0,2404

0,4737

0,2407

0,2392

0,2387

 

.AGE.85-X:GENDER.F

0,8484

0,4722

0,8467

0,837

0,8875

 

.ref

0,028

0,4658

0,0224

0,0071

0,1269

nVar

7

6

6

post probability

0,8022

0,1253

0,072


AGE ref.level: .20-24

GENDER ref.level: .MALE

A modellek közötti választás problémájára másfajta megoldást kínál a Bayes-féle modell átlagolás, ezt a módszert népszerűsíti a hivatkozott Hoeting[bib_5] et.all. cikk. Az eljárás az R nyelven a BMA csomagból érhető el (Raftery et.all BMA [bib_6]). A 3.1.10. példában a kiindulási modellben szerepel a 3.1.6-9. modellek minden magyarázó változója, a program a futás során módszeresen elhagy néhányat a magyarázó változók közül, és az illesztett modell likelihood értéke alapján minden modellhez egy (aposteriori) részvételi valószínűséget rendel.

A példában három modell került kiválasztásra, ezek részvételi valószínűsége a lista utolsó sorában jelenik meg: 0,8022 0,1253 0,072.

A három modell részvételi valószínűségeinek összege majdnem =1 (az összes többi modell osztozik a maradék valószínűségen, tehát azok a modellek mind elhanyagolhatók).

Az 1. modellben minden változó szerepel, a 2. modellben kimarad a munkanelkarany, a 3. modellben kimarad a felsofoku. A táblázat második oszlopában ahol % érték van, az azt jelenti, hogy azoknak a modelleknek, ahol ez a változó szerepel, mennyi a részvételi valószínűségek összege.

A három modellben kapott paraméterbecsléseket a modell részvételi valószínűségével súlyozottan átlagoljuk, és így kapjuk a paraméter BMA becslését. Ez általában közel van az 1. modellbeli értékekhez (hiszen ennek a súlya 80%) , de pl. az AGE:GENDER interakció referencia-cellájánál kissé eltér. Az eljárás neves népszerűsítője Adrian Raftery, számos cikkben igazolta statisztikai stabilitását.