Vokó Zoltán, Kabos Sándor, Lőw András
ELTE
Tartalom
Ebben a fejezetben Vas megyei mortalitási adatokat elemzünk.
teljes halálozás településenként, életkor (5-éves korcsoport) és nem szerinti bontásban
lakónépesség (ugyanilyen bontásban)
környezeti változók településenként
lakosságszám (LSZKOD), a település mentőállomástól való távolsága (mento), munkanélküliek aránya (munkanelkarany), középiskola legmagasabb végzettséggel rendelkezők aránya (kozepisk), felsőfokú végzettségűek aránya (felsofoku).
Az alkalmazott regressziós eljárások statisztikai hátterének összefoglalása a 2.2. és a 3.2. fejezetekben.
3.1. példa - Poisson regresszió, mortalitás korcsoportok szerint
Változó | Incidencia sűrűség hányados (ISH) | Együttható | Az együttható standard hibája | z –érték | Pr(>|z|) |
---|---|---|---|---|---|
(Intercept) | 0,00071 | -7,2502 | 0,32455 | -22,3392 | 0 |
AGE.00-00 | 3,45294 | 1,23922 | 0,37321 | 3,32045 | 0,0009 |
AGE.01-04 | 0,37085 | -0,99195 | 0,64734 | -1,53235 | 0,12544 |
AGE.05-09 | 0,19086 | -1,6562 | 0,82802 | -2,00018 | 0,04548 |
AGE.10-14 | 0,35258 | -1,04249 | 0,62106 | -1,67857 | 0,09324 |
AGE.15-19 | 0,55239 | -0,5935 | 0,48945 | -1,2126 | 0,22528 |
AGE.25-29 | 1,31103 | 0,27081 | 0,40089 | 0,67553 | 0,49934 |
AGE.30-34 | 2,10434 | 0,744 | 0,37013 | 2,01011 | 0,04442 |
AGE.35-39 | 3,43103 | 1,23286 | 0,33577 | 3,67174 | 0,00024 |
AGE.40-44 | 7,82675 | 2,05755 | 0,3102 | 6,63304 | 0 |
AGE.45-49 | 14,90628 | 2,70178 | 0,30362 | 8,89848 | 0 |
AGE.50-54 | 22,84387 | 3,12868 | 0,30127 | 10,38491 | 0 |
AGE.55-59 | 30,3301 | 3,41214 | 0,30022 | 11,36544 | 0 |
AGE.60-64 | 40,05764 | 3,69032 | 0,29893 | 12,34507 | 0 |
AGE.65-69 | 57,16813 | 4,046 | 0,2975 | 13,59979 | 0 |
AGE.70-74 | 103,54153 | 4,63997 | 0,29611 | 15,66984 | 0 |
AGE.75-79 | 260,15598 | 5,56128 | 0,29553 | 18,81826 | 0 |
AGE.80-84 | 280,80722 | 5,63767 | 0,29637 | 19,02216 | 0 |
AGE.85-X | 505,2024 | 6,22496 | 0,29545 | 21,06971 | 0 |
AGE ref.level: .20-24
Egyetlen magyarázó változó van: az életkor (kategóriák 5-éves korcsoportonként).
α : a táblázat (Tengelymetszet) sorában írt becslés
β: pl. a táblázat (AGE.50-54) sorában az 50-54 korcsoportra vonatkozó együttható becslése.
A táblázat oszlopainak jelentése
első oszlop: a változó megnevezése,
második oszlop: az együttható becslése, exponenciálisa az incidencia sűrűség (arányszám hányados), amely a hozzátartozó változó egységnyi változásához tartozik. Jelen esetben az X-ek indikátor változók, értékük 1 az adott korcsoportban, egyébként 0.
harmadik oszlop: incidencia sűrűség (arányszám) hányados
negyedik oszlop: a becslés standard hibája ,
az ötödik oszlop: a számított Wald-féle z-statisztika értéke
hatodik oszlop: az együttható számított szignifikanciaszintje.
A referencia csoport a 20-24 évesek, körükben a mortalitás=exp(α)=exp(-7,51595)= 0,00054 azaz 5,4 per 10000 személy-év. Az 50-54 éves korosztályban a mortalitás ehhez képest exp(beta)=exp(3,12868)=22,84-szeres.
3.2. példa - Poisson regresszió, mortalitás a korcsoport, nem szerint
Változó | Incidencia sűrűség hányados (ISH) | Együttható | Az együttható standard hibája | z –érték | Pr(>|z|) |
---|---|---|---|---|---|
(Intercept) | 0,00068 | -7,2915 | 0,29301 | -24,8845 | 0 |
AGE.00-00 | 3,45429 | 1,23962 | 0,37321 | 3,3215 | 9,00E-004 |
AGE.01-04 | 0,37202 | -0,98881 | 0,64734 | -1,52749 | 0,12664 |
AGE.05-09 | 0,19096 | -1,65571 | 0,82801 | -1,99963 | 0,04554 |
AGE.10-14 | 0,35388 | -1,03879 | 0,62106 | -1,67261 | 0,0944 |
AGE.15-19 | 0,55385 | -0,59085 | 0,48945 | -1,20718 | 0,22736 |
AGE.25-29 | 1,3131 | 0,27239 | 0,40089 | 0,67946 | 0,49685 |
AGE.30-34 | 2,10691 | 0,74522 | 0,37013 | 2,01341 | 0,04407 |
AGE.35-39 | 3,45253 | 1,23911 | 0,33577 | 3,69035 | 0,00022 |
AGE.40-44 | 7,87562 | 2,06377 | 0,3102 | 6,6531 | 0 |
AGE.45-49 | 15,01495 | 2,70905 | 0,30362 | 8,9224 | 0 |
AGE.50-54 | 23,3062 | 3,14872 | 0,30127 | 10,45134 | 0 |
AGE.55-59 | 31,48157 | 3,4494 | 0,30023 | 11,48923 | 0 |
AGE.60-64 | 42,24041 | 3,74338 | 0,29895 | 12,52183 | 0 |
AGE.65-69 | 61,28111 | 4,11547 | 0,29754 | 13,83188 | 0 |
AGE.70-74 | 112,7548 | 4,72522 | 0,29616 | 15,95518 | 0 |
AGE.75-79 | 287,93925 | 5,66275 | 0,29559 | 19,15719 | 0 |
AGE.80-84 | 318,76084 | 5,76444 | 0,29648 | 19,44276 | 0 |
AGE.85-X | 509,1224 | 6,23269 | 0,29545 | 21,09585 | 0 |
GENDER.F | 0,58561 | -0,53511 | 0,0336 | -15,92586 | 0 |
AGE ref.level: .20-24
GENDER ref.level: .MALE
3.3. példa - Poisson regresszió, mortalitás a korcsoport, nem és a lakhely település környezeti változói szerint
Változó | Incidencia sűrűség hányados (ISH) | Együttható | Az együttható standard hibája | z -érték | Pr(>|z|) |
---|---|---|---|---|---|
(Intercept) | 0,00122 | -6,70968 | 0,35556 | -18,87095 | 0 |
AGE.00-00 | 3,11553 | 1,1364 | 0,37166 | 3,05763 | 0,00223 |
AGE.01-04 | 0,42709 | -0,85076 | 0,59933 | -1,41952 | 0,15575 |
AGE.05-09 | 0,22017 | -1,51333 | 0,76365 | -1,98172 | 0,04751 |
AGE.10-14 | 0,33879 | -1,08237 | 0,60749 | -1,78169 | 0,0748 |
AGE.15-19 | 0,55029 | -0,59731 | 0,47832 | -1,24876 | 0,21175 |
AGE.25-29 | 1,35989 | 0,3074 | 0,3934 | 0,7814 | 0,43457 |
AGE.30-34 | 2,11189 | 0,74758 | 0,36308 | 2,05903 | 0,03949 |
AGE.35-39 | 3,34322 | 1,20694 | 0,33025 | 3,65465 | 0,00026 |
AGE.40-44 | 7,89268 | 2,06594 | 0,30582 | 6,75538 | 0 |
AGE.45-49 | 14,65945 | 2,68509 | 0,29971 | 8,95887 | 0 |
AGE.50-54 | 22,29776 | 3,10449 | 0,29747 | 10,43637 | 0 |
AGE.55-59 | 31,00256 | 3,43407 | 0,29624 | 11,59209 | 0 |
AGE.60-64 | 41,79252 | 3,73272 | 0,29484 | 12,65999 | 0 |
AGE.65-69 | 62,85608 | 4,14085 | 0,29338 | 14,11437 | 0 |
AGE.70-74 | 124,779 | 4,82654 | 0,29203 | 16,52779 | 0 |
AGE.75-79 | 274,12125 | 5,61357 | 0,2917 | 19,24414 | 0 |
AGE.80-84 | 339,13257 | 5,82639 | 0,29231 | 19,93216 | 0 |
AGE.85-X | 744,27166 | 6,61241 | 0,29294 | 22,5729 | 0 |
GENDER.F | 0,59625 | -0,5171 | 0,04428 | -11,67897 | 0 |
kozepiskola | 0,98951 | -0,01055 | 0,00551 | -1,91588 | 0,05538 |
felsofoku | 1,00789 | 0,00786 | 0,01057 | 0,74334 | 0,45727 |
munkanelkarany | 0,98499 | -0,01512 | 0,00733 | -2,0623 | 0,03918 |
LSZKOD. 5000+ | 0,91834 | -0,08519 | 0,07832 | -1,08769 | 0,27673 |
LSZKOD. 3-5000 | 0,74271 | -0,29745 | 0,12796 | -2,32451 | 0,0201 |
LSZKOD. 1-3000 | 0,70274 | -0,35276 | 0,12734 | -2,77023 | 0,0056 |
LSZKOD. 500-1000 | 0,61445 | -0,48703 | 0,14116 | -3,45024 | 0,00056 |
LSZKOD. -500 | 0,34544 | -1,06294 | 0,15225 | -6,98165 | 0 |
mento | 1,0031 | 0,00309 | 0,00196 | 1,5768 | 0,11484 |
AGE ref.level: .20-24
GENDER ref.level: .MALE
LSZKOD ref.level= .MEGYESZÉKHELY
Itt kategoriális magyarázó változók (GENDER, AGE, LSZKOD) mellett szám-értékű változók is megjelentek (kozepiskola, felsofoku, munkanelkarany, mento), ezt a modellt 3.2.1. írja le.
3.4. példa - A modellek illeszkedésének mérőszáma
3.1.1. modell: (resid deviance = 4602,84 , resid df = 8189 )
3.1.2. modell: (resid deviance = 4349,36 , resid df = 8188 )
3.1.3. modell: (resid deviance = 3753,85 , resid df = 8179 )
A 2.2. fejezetben elmondottak alapján megállapíthatjuk, hogy ezek a modellek mind illeszkednek, ezért az egyes tényezőkre vonatkozó becsléseket, azok szignifikanciáját érvényesnek tekintjük. Az érvényesség a modellen belül értendő, mivel ha változtatunk azon, hogy mely magyarázó változókat vesszük be a modellbe, az természetesen a becsléseket is megváltoztatja.
Megfigyelhetjük, hogy az 3.1.2. táblázat becslései megváltoztak az 3.1.1. táblázatéhoz képest (mármint azok, melyek ott is szerepeltek), hasonlóan az 3.1.3. táblázat becslései az 3.1.2. táblázatéhoz képest.
3.5. példa - Poisson regresszió, mortalitás a lakhely település környezeti változói szerint, nem és korcsoport figyelembevétele nélkül
Változó | Incidencia sűrűség hányados (ISH) | Együttható | Az együttható standard hibája | z -érték | Pr(>|z|) |
---|---|---|---|---|---|
(Intercept) | 0,04134 | -3,18602 | 0,21401 | -14,88734 | 0 |
kozepiskola | 0,96725 | -0,03329 | 0,005 | -6,65278 | 0 |
felsofoku | 1,02766 | 0,02728 | 0,00798 | 3,41889 | 0,00063 |
munkanelkarany | 0,97737 | -0,02289 | 0,00766 | -2,98876 | 0,0028 |
LSZKOD. 5000+ | 0,68222 | -0,38241 | 0,07857 | -4,8672 | 0 |
LSZKOD. 3-5000 | 0,49321 | -0,70683 | 0,12971 | -5,44912 | 0 |
LSZKOD. 1-3000 | 0,53013 | -0,63463 | 0,12921 | -4,91166 | 0 |
LSZKOD. 500-1000 | 0,67018 | -0,40021 | 0,14163 | -2,82578 | 0,00472 |
LSZKOD. -500 | 0,56793 | -0,56576 | 0,15222 | -3,71661 | 2,00E-004 |
mento | 1,00642 | 0,0064 | 0,00198 | 3,23741 | 0,00121 |
LSZKOD ref.level= .MEGYESZÉKHELY
3.1.4.modell: (resid deviance = 14878,4 , resid df = 8198 )
Ezért ez a modell nem illeszkedik.
3.6. példa - Poisson regresszió, mortalitás a lakhely település környezeti változói szerint, nemre és korcsoportra standardizálva
Változó | Incidencia sűrűség hányados (ISH) | Együttható | Az együttható standard hibája | z -érték | Pr(>|z|) |
---|---|---|---|---|---|
(Intercept) | 0,04109 | -3,19197 | 0,20983 | -15,21182 | 0 |
kozepiskola | 0,98552 | -0,01458 | 0,0049 | -2,97373 | 0,00294 |
felsofoku | 0,97107 | -0,02935 | 0,00806 | -3,64242 | 0,00027 |
munkanelkarany | 0,97953 | -0,02068 | 0,00753 | -2,7449 | 0,00605 |
LSZKOD. 5000+ | 0,63739 | -0,45037 | 0,07842 | -5,74307 | 0 |
LSZKOD. 3-5000 | 0,46398 | -0,76791 | 0,12801 | -5,99893 | 0 |
LSZKOD. 1-3000 | 0,49395 | -0,70533 | 0,12744 | -5,53445 | 0 |
LSZKOD. 500-1000 | 0,58338 | -0,53892 | 0,1399 | -3,85207 | 0,00012 |
LSZKOD. -500 | 0,51553 | -0,66257 | 0,15005 | -4,41564 | 1,00E-005 |
mento | 1,00766 | 0,00763 | 0,00194 | 3,92591 | 9,00E-005 |
LSZKOD ref.level= .MEGYESZÉKHELY
3.1.5.modell: (resid deviance = 4036,98 , resid df = 8198 )
A standardizálás műveletét a 3.2.2. fejezet írja le. A technikai megvalósítás az, hogy a kor és nem szerinti kategóriákban vett országos mortalitás érték és a népességszám szorzatát (pontosabban a szorzat logaritmusát) alkalmazzuk offset változóként.
Az interpretáció számára a lényeges az, hogy a standardizálással készült táblázatban az ISH értékek azt mutatják, hogy az egyes kategóriákban hogyan aránylik a Vas megyei mortalitás az országos átlag (ugyanilyen kategóriájában vett) mortalitás értékéhez.
Mint látjuk, ugyanazok a magyarázó változók a legutóbbi két példában. A standardizálás nélküli 3.1.4. modell nem illeszkedett, a standardizálással készült 3.1.5. modell igen.
3.7. példa - Poisson regresszió, mortalitás a korcsoport és a lakhely település környezeti változói szerint, nemre és korcsoportra standardizálva
Változó | Incidencia sűrűség hányados (ISH) | Együttható | Az együttható standard hibája | z -érték | Pr(>|z|) |
---|---|---|---|---|---|
(Intercept) | 0,02659 | -3,62712 | 0,35723 | -10,15354 | 0 |
AGE.00-00 | 0,22123 | -1,50854 | 0,3717 | -4,05849 | 5,00E-005 |
AGE.01-04 | 0,68612 | -0,37671 | 0,59935 | -0,62852 | 0,52966 |
AGE.05-09 | 0,75215 | -0,28482 | 0,76373 | -0,37294 | 0,70919 |
AGE.10-14 | 1,01544 | 0,01532 | 0,60751 | 0,02522 | 0,97988 |
AGE.15-19 | 0,80295 | -0,21946 | 0,47832 | -0,45882 | 0,64636 |
AGE.25-29 | 1,05624 | 0,05471 | 0,3934 | 0,13907 | 0,88939 |
AGE.30-34 | 0,97681 | -0,02347 | 0,36308 | -0,06463 | 0,94847 |
AGE.35-39 | 0,77735 | -0,25187 | 0,33025 | -0,76266 | 0,44566 |
AGE.40-44 | 0,96743 | -0,03311 | 0,30582 | -0,10826 | 0,91379 |
AGE.45-49 | 1,19191 | 0,17556 | 0,29971 | 0,58576 | 0,55804 |
AGE.50-54 | 1,27781 | 0,24515 | 0,29747 | 0,82411 | 0,40988 |
AGE.55-59 | 1,29933 | 0,26185 | 0,29624 | 0,8839 | 0,37675 |
AGE.60-64 | 1,23469 | 0,21082 | 0,29484 | 0,71503 | 0,47459 |
AGE.65-69 | 1,28403 | 0,25 | 0,29338 | 0,85213 | 0,39414 |
AGE.70-74 | 1,67405 | 0,51524 | 0,29205 | 1,76426 | 0,07769 |
AGE.75-79 | 2,33802 | 0,8493 | 0,29174 | 2,91114 | 0,0036 |
AGE.80-84 | 1,78617 | 0,58007 | 0,29238 | 1,98401 | 0,04726 |
AGE.85-X | 2,23482 | 0,80416 | 0,29289 | 2,74559 | 0,00604 |
kozepiskola | 0,98137 | -0,01881 | 0,00494 | -3,80464 | 0,00014 |
felsofoku | 0,98752 | -0,01256 | 0,00817 | -1,53734 | 0,12421 |
munkanelkarany | 0,97932 | -0,02089 | 0,00751 | -2,78341 | 0,00538 |
LSZKOD. 5000+ | 0,68046 | -0,38499 | 0,07853 | -4,90236 | 0 |
LSZKOD. 3-5000 | 0,49377 | -0,70569 | 0,12831 | -5,49989 | 0 |
LSZKOD. 1-3000 | 0,50577 | -0,68167 | 0,12821 | -5,31706 | 0 |
LSZKOD. 500-1000 | 0,55783 | -0,58369 | 0,14131 | -4,13065 | 4,00E-005 |
LSZKOD. -500 | 0,44997 | -0,79859 | 0,15301 | -5,21907 | 0 |
mento | 1,00708 | 0,00705 | 0,00195 | 3,62273 | 0,00029 |
3.1.6.modell: (resid deviance = 3621,65 , resid df = 8180 )
AGE ref.level: .20-24
GENDER ref.level: .MALE
LSZKOD ref.level= .MEGYESZÉKHELY
3.8. példa - Poisson regresszió, mortalitás a korcsoport, nem és a lakhely település környezeti változói szerint, nemre és korcsoportra standardizálva
Változó | Incidencia sűrűség hányados (ISH) | Együttható | Az együttható standard hibája | z -érték | Pr(>|z|) |
---|---|---|---|---|---|
(Intercept) | 0,0265 | -3,63054 | 0,35748 | -10,15606 | 0 |
AGE.00-00 | 0,22097 | -1,50972 | 0,37172 | -4,06139 | 5,00E-005 |
AGE.01-04 | 0,68544 | -0,3777 | 0,59936 | -0,63017 | 0,52858 |
AGE.05-09 | 0,75139 | -0,28583 | 0,76374 | -0,37425 | 0,70822 |
AGE.10-14 | 1,01467 | 0,01456 | 0,60751 | 0,02397 | 0,98088 |
AGE.15-19 | 0,80268 | -0,2198 | 0,47832 | -0,45951 | 0,64586 |
AGE.25-29 | 1,05621 | 0,05469 | 0,3934 | 0,13902 | 0,88944 |
AGE.30-34 | 0,97687 | -0,0234 | 0,36308 | -0,06445 | 0,94861 |
AGE.35-39 | 0,77731 | -0,25191 | 0,33025 | -0,76279 | 0,44559 |
AGE.40-44 | 0,96742 | -0,03313 | 0,30582 | -0,10832 | 0,91374 |
AGE.45-49 | 1,1918 | 0,17547 | 0,29971 | 0,58545 | 0,55825 |
AGE.50-54 | 1,27754 | 0,24494 | 0,29747 | 0,82341 | 0,41027 |
AGE.55-59 | 1,29882 | 0,26145 | 0,29625 | 0,88255 | 0,37748 |
AGE.60-64 | 1,23396 | 0,21023 | 0,29485 | 0,71301 | 0,47584 |
AGE.65-69 | 1,28282 | 0,24906 | 0,2934 | 0,84887 | 0,39595 |
AGE.70-74 | 1,67175 | 0,51387 | 0,29209 | 1,7593 | 0,07853 |
AGE.75-79 | 2,33349 | 0,84737 | 0,29183 | 2,90365 | 0,00369 |
AGE.80-84 | 1,78169 | 0,57756 | 0,29252 | 1,97445 | 0,04833 |
AGE.85-X | 2,23189 | 0,80285 | 0,29293 | 2,74072 | 0,00613 |
GENDER.F | 1,01226 | 0,01218 | 0,04443 | 0,2742 | 0,78393 |
kozepiskola | 0,98071 | -0,01948 | 0,00552 | -3,52954 | 0,00042 |
felsofoku | 0,98937 | -0,01068 | 0,01066 | -1,00236 | 0,31617 |
munkanelkarany | 0,97928 | -0,02094 | 0,00751 | -2,78965 | 0,00528 |
LSZKOD. 5000+ | 0,68284 | -0,38149 | 0,07955 | -4,79573 | 0 |
LSZKOD. 3-5000 | 0,49547 | -0,70224 | 0,12893 | -5,44685 | 0 |
LSZKOD. 1-3000 | 0,50769 | -0,67789 | 0,12896 | -5,2564 | 0 |
LSZKOD. 500-1000 | 0,56017 | -0,57951 | 0,14215 | -4,07669 | 5,00E-005 |
LSZKOD. -500 | 0,45167 | -0,79481 | 0,15366 | -5,17245 | 0 |
mento | 1,00704 | 0,00702 | 0,00195 | 3,59897 | 0,00032 |
AGE ref.level: .20-24
GENDER ref.level: .MALE
LSZKOD ref.level= .MEGYESZÉKHELY
3.1.7.modell: (resid deviance = 3621,58 , resid df = 8179)
Az értelmezésben fontos a standardizálás figyelembevétele, tehát pl. itt az AGE együtthatók a hasonló korosztályos országos adatokhoz viszonyítják a vasi adatokat. Látható, hogy az együtthatók általában nem szignifikánsak, kivéve a 75+ korosztályokat, ahol a Vasi mortalitás jelentősen meghaladja az országos átlagot.
Emlékszünk, hogy az 3.1.2. modellben megjelenő GENDER az 3.1.1. modell resid deviance értékét 250-nel javította, a standardizálás után ez a változó csak 0.07 javulást hozott. Ez azt jelenti, hogy a nemek közötti különbségek nagyjából az országos átlag szerint alakulnak Vas megyében. GENDER.F nagyobb, mint 1 és nem szignifikáns (a standardizálás előtt kisebb volt, mint 1, és szignifikáns). Ennek is az az oka, hogy a relatív incidencia sűrűség, amit számolunk, tehát mindig az azonos kategóriájú országos adatokhoz viszonyítunk.
3.9. példa - Poisson regresszió, mortalitás a korcsoport, nem és a lakhely település iskolai végzettség (kozepiskola, felsofoku) változói szerint, nemre és korcsoportra standardizálva
Változó | Incidencia sűrűség hányados (ISH) | Együttható | Az együttható standard hibája | z –érték | Pr(>|z|) |
---|---|---|---|---|---|
(Intercept) | 0,01026 | -4,57944 | 0,29233 | -15,66512 | 0 |
AGE.00-00 | 0,22033 | -1,51264 | 0,37172 | -4,06926 | 5,00E-005 |
AGE.01-04 | 0,6816 | -0,38331 | 0,59936 | -0,63954 | 0,52247 |
AGE.05-09 | 0,74633 | -0,29259 | 0,76365 | -0,38315 | 0,70161 |
AGE.10-14 | 1,00861 | 0,00857 | 0,60751 | 0,01411 | 0,98874 |
AGE.15-19 | 0,80096 | -0,22195 | 0,47832 | -0,46401 | 0,64264 |
AGE.25-29 | 1,05496 | 0,0535 | 0,3934 | 0,136 | 0,89182 |
AGE.30-34 | 0,97401 | -0,02633 | 0,36308 | -0,07252 | 0,94219 |
AGE.35-39 | 0,77467 | -0,25532 | 0,33025 | -0,77312 | 0,43945 |
AGE.40-44 | 0,96576 | -0,03484 | 0,30582 | -0,11392 | 0,9093 |
AGE.45-49 | 1,19301 | 0,17648 | 0,29971 | 0,58883 | 0,55598 |
AGE.50-54 | 1,28144 | 0,24799 | 0,29747 | 0,83365 | 0,40448 |
AGE.55-59 | 1,30372 | 0,26522 | 0,29624 | 0,89529 | 0,37063 |
AGE.60-64 | 1,24009 | 0,21518 | 0,29485 | 0,72981 | 0,46551 |
AGE.65-69 | 1,29092 | 0,25536 | 0,2934 | 0,87035 | 0,38411 |
AGE.70-74 | 1,68605 | 0,52239 | 0,29208 | 1,78853 | 0,07369 |
AGE.75-79 | 2,3584 | 0,85798 | 0,29182 | 2,94013 | 0,00328 |
AGE.80-84 | 1,80165 | 0,5887 | 0,2925 | 2,01264 | 0,04415 |
AGE.85-X | 2,22041 | 0,79769 | 0,29236 | 2,72848 | 0,00636 |
GENDER.F | 1,04166 | 0,04081 | 0,04362 | 0,93575 | 0,3494 |
kozepiskola | 0,9929 | -0,00713 | 0,00423 | -1,68638 | 0,09172 |
felsofoku | 1,00341 | 0,00341 | 0,01 | 0,34102 | 0,73309 |
AGE ref.level: .20-24
GENDER ref.level: .MALE
3.1.8.modell: (resid deviance = 3999,5 , resid df = 8186 )
Ebben a modellben a középiskolát végzettek aránya gyengén (p=0.092) szignifikáns, és ahol nagyobb az értéke, ott kicsit kisebb a mortalitás. A felsőfokú végzettségűek arányának nincs kimutatható hatása.
3.10. példa - Poisson regresszió, mortalitás a korcsoport, nem és a lakhely település egyéb jellemzői (munkanelkarany, mento, LSZKOD) változója szerint, nemre és korcsoportra standardizálva
Változó | Incidencia sűrűség hányados (ISH) | Együttható | Az együttható standard hibája | z -érték | Pr(>|z|) |
---|---|---|---|---|---|
(Intercept) | 0,0088 | -4,73349 | 0,29205 | -16,20756 | 0 |
AGE.00-00 | 0,22143 | -1,50764 | 0,37172 | -4,05582 | 5,00E-005 |
AGE.01-04 | 0,68583 | -0,37712 | 0,59936 | -0,6292 | 0,52922 |
AGE.05-09 | 0,75029 | -0,28729 | 0,76373 | -0,37617 | 0,70679 |
AGE.10-14 | 1,01237 | 0,0123 | 0,60751 | 0,02024 | 0,98385 |
AGE.15-19 | 0,80185 | -0,22084 | 0,47832 | -0,4617 | 0,6443 |
AGE.25-29 | 1,0572 | 0,05562 | 0,3934 | 0,14139 | 0,88756 |
AGE.30-34 | 0,97763 | -0,02263 | 0,36308 | -0,06232 | 0,95031 |
AGE.35-39 | 0,77742 | -0,25178 | 0,33025 | -0,76239 | 0,44582 |
AGE.40-44 | 0,96695 | -0,0336 | 0,30582 | -0,10988 | 0,9125 |
AGE.45-49 | 1,19237 | 0,17595 | 0,29971 | 0,58705 | 0,55717 |
AGE.50-54 | 1,28005 | 0,2469 | 0,29747 | 0,83001 | 0,40654 |
AGE.55-59 | 1,30467 | 0,26595 | 0,29624 | 0,89775 | 0,36932 |
AGE.60-64 | 1,24151 | 0,21633 | 0,29485 | 0,7337 | 0,46313 |
AGE.65-69 | 1,29156 | 0,25585 | 0,2934 | 0,87203 | 0,38319 |
AGE.70-74 | 1,68517 | 0,52186 | 0,29208 | 1,78672 | 0,07398 |
AGE.75-79 | 2,35188 | 0,85521 | 0,29182 | 2,93062 | 0,00338 |
AGE.80-84 | 1,79682 | 0,58602 | 0,29251 | 2,00342 | 0,04513 |
AGE.85-X | 2,24872 | 0,81036 | 0,29293 | 2,76641 | 0,00567 |
GENDER.F | 1,02644 | 0,0261 | 0,03393 | 0,76924 | 0,44175 |
munkanelkarany | 0,99013 | -0,00992 | 0,00718 | -1,38206 | 0,16695 |
LSZKOD. 5000+ | 0,93663 | -0,06547 | 0,05128 | -1,27666 | 0,20172 |
LSZKOD. 3-5000 | 0,80782 | -0,21342 | 0,09119 | -2,34049 | 0,01926 |
LSZKOD. 1-3000 | 0,9224 | -0,08077 | 0,06178 | -1,3075 | 0,19104 |
LSZKOD. 500-1000 | 1,10263 | 0,09769 | 0,06343 | 1,54011 | 0,12353 |
LSZKOD. -500 | 0,93319 | -0,06915 | 0,07123 | -0,97074 | 0,33168 |
mento | 1,00701 | 0,00699 | 0,00194 | 3,59826 | 0,00032 |
AGE ref.level: .20-24
GENDER ref.level: .MALE
LSZKOD ref.level= .MEGYESZÉKHELY
3.1.9.modell: (resid deviance = 3963,26 , resid df = 8181 )
Ebben a modellben a mentőállomástól való távolság hatása szignifikáns, ahol nagyobb a távolság ott magasabb a mortalitás. Ezen kívül az LSZKOD 3-5000 hatása szignifikáns.
Összefoglalva: a 3.1.4. példában minden környezeti változó parciális hatása szignifikáns (a felsőfokú végzettségűek aránya kivételével), de itt a modell nem illeszkedik. A 3.1.5. példa illeszkedő modell mellett kapjuk ugyanezt az eredményt, majd a 3.1.6. példában az AGE és a 3.1.7. példában a GENDER is magyarázó változó lett, és ez csökkentette a környezeti változók magyarázó erejét. Az igazán meglepő azonban a 3.1.8. és 3.1.9. példa, ahol még a környezeti változók egy-egy csoportját is kivettük a modellből, és ennek hatására a bent maradó változók hatása nem nőtt hanem csökkent.
A változószelekció a Poisson regressziónál nem végezhető a lineáris modellben megszokott parciális korreláción alapuló eljárásokkal, a modellben szereplő változók parciális hatását mutató szignifikancia értéket csak közelítésnek szabad tekinteni. A magyarázó változók szelekcióját az általánosított lineáris modell deviance statisztikáján alapuló módszerrel végezhetjük, erre szolgál az R bestglm csomagja (McLeod, A.I. – Xu, C.: Best Subset GLM package[bib_7]).
3.11. példa - BMA Bayes-féle modell átlagolási eljárás. Poisson regresszió, mortalitás a korcsoport, nem és a lakhely település egyéb jellemzői változója szerint, nemre és korcsoportra standardizálva.
változó | szint/részvételi arány | Együttható | Az együttható standard hibája | 1.model | 2.model | 3.model |
---|---|---|---|---|---|---|
(Intercept) | 100,00% | -5,5059 | 0,5635 | -5,514 | -5,329 | -5,726 |
AGE | 100,00% | 0,3505 | 0,0153 | 0,3496 | 0,3524 | 0,3564 |
GENDER | 100,00% |
|
|
|
|
|
| AGE.00-00 | -0,1832 | 0,4321 | -0,1841 | -0,1942 | -0,1541 |
| AGE.01-04 | -1,1685 | 0,8676 | -1,171 | -1,175 | -1,125 |
| AGE.05-09 | -1,5123 | 1,1342 | -1,516 | -1,517 | -1,465 |
| AGE.10-14 | -0,6795 | 0,7401 | -0,6828 | -0,6851 | -0,634 |
| AGE.15-19 | -0,1821 | 0,5348 | -0,1846 | -0,1899 | -0,1416 |
| AGE.25-29 | 0,4581 | 0,4159 | 0,4562 | 0,4491 | 0,4951 |
| AGE.30-34 | 0,5994 | 0,389 | 0,5978 | 0,5897 | 0,6335 |
| AGE.35-39 | 0,9215 | 0,3499 | 0,9207 | 0,9103 | 0,9496 |
| AGE.40-44 | 1,5672 | 0,3185 | 1,567 | 1,554 | 1,591 |
| AGE.45-49 | 1,9115 | 0,3111 | 1,911 | 1,898 | 1,935 |
| AGE.50-54 | 2,1589 | 0,3076 | 2,159 | 2,145 | 2,182 |
| AGE.55-59 | 2,2371 | 0,3067 | 2,237 | 2,223 | 2,259 |
| AGE.60-64 | 2,2853 | 0,3059 | 2,286 | 2,271 | 2,306 |
| AGE.65-69 | 2,4398 | 0,3046 | 2,44 | 2,426 | 2,459 |
| AGE.70-74 | 2,6509 | 0,3032 | 2,652 | 2,637 | 2,668 |
| AGE.75-79 | 2,8538 | 0,302 | 2,854 | 2,84 | 2,875 |
| AGE.80-84 | 2,4834 | 0,3049 | 2,483 | 2,47 | 2,507 |
| AGE.85-X | 2,5241 | 0,3051 | 2,525 | 2,516 | 2,529 |
felsofoku | 92,80% | 0,032 | 0,0126 | 0,0338 | 0,0388 | - |
kozepiskola | 100,00% | 0,0772 | 0,0056 | 0,0767 | 0,0736 | 0,0895 |
munkanelkarany | 87,50% | 0,023 | 0,011 | 0,026 | - | 0,0301 |
mento | 100,00% | -0,0142 | 0,0021 | -0,0145 | -0,0123 | -0,0149 |
AGE.GENDER.. | 100,00% |
|
|
|
|
|
| .AGE.01-04:GENDER.F | 0,1938 | 1,2445 | 0,1936 | 0,194 | 0,1959 |
| .AGE.05-09:GENDER.F | 0,1788 | 1,6172 | 0,1787 | 0,1783 | 0,1807 |
| .AGE.10-14:GENDER.F | -0,368 | 1,2386 | -0,3683 | -0,3675 | -0,3652 |
| .AGE.15-19:GENDER.F | -0,8524 | 1,0403 | -0,8529 | -0,8507 | -0,8497 |
| .AGE.25-29:GENDER.F | -1,396 | 0,9208 | -1,397 | -1,394 | -1,391 |
| .AGE.30-34:GENDER.F | -0,8707 | 0,7216 | -0,8715 | -0,8692 | -0,8651 |
| .AGE.35-39:GENDER.F | -0,721 | 0,6004 | -0,7217 | -0,7195 | -0,7152 |
| .AGE.40-44:GENDER.F | -0,6459 | 0,5201 | -0,6466 | -0,6435 | -0,6415 |
| .AGE.45-49:GENDER.F | -0,4664 | 0,4967 | -0,4671 | -0,464 | -0,4634 |
| .AGE.50-54:GENDER.F | -0,6451 | 0,4914 | -0,6458 | -0,6433 | -0,641 |
| .AGE.55-59:GENDER.F | -0,6121 | 0,4871 | -0,6129 | -0,6103 | -0,6067 |
| .AGE.60-64:GENDER.F | -0,4223 | 0,4815 | -0,4228 | -0,4214 | -0,4177 |
| .AGE.65-69:GENDER.F | -0,3533 | 0,4769 | -0,3537 | -0,3537 | -0,3486 |
| .AGE.70-74:GENDER.F | -0,1274 | 0,4726 | -0,1276 | -0,1284 | -0,1225 |
| .AGE.75-79:GENDER.F | 0,0839 | 0,4711 | 0,0839 | 0,0832 | 0,0862 |
| .AGE.80-84:GENDER.F | 0,2404 | 0,4737 | 0,2407 | 0,2392 | 0,2387 |
| .AGE.85-X:GENDER.F | 0,8484 | 0,4722 | 0,8467 | 0,837 | 0,8875 |
| .ref | 0,028 | 0,4658 | 0,0224 | 0,0071 | 0,1269 |
nVar | 7 | 6 | 6 | |||
post probability | 0,8022 | 0,1253 | 0,072 |
AGE ref.level: .20-24
GENDER ref.level: .MALE
A modellek közötti választás problémájára másfajta megoldást kínál a Bayes-féle modell átlagolás, ezt a módszert népszerűsíti a hivatkozott Hoeting[bib_5] et.all. cikk. Az eljárás az R nyelven a BMA csomagból érhető el (Raftery et.all BMA [bib_6]). A 3.1.10. példában a kiindulási modellben szerepel a 3.1.6-9. modellek minden magyarázó változója, a program a futás során módszeresen elhagy néhányat a magyarázó változók közül, és az illesztett modell likelihood értéke alapján minden modellhez egy (aposteriori) részvételi valószínűséget rendel.
A példában három modell került kiválasztásra, ezek részvételi valószínűsége a lista utolsó sorában jelenik meg: 0,8022 0,1253 0,072.
A három modell részvételi valószínűségeinek összege majdnem =1 (az összes többi modell osztozik a maradék valószínűségen, tehát azok a modellek mind elhanyagolhatók).
Az 1. modellben minden változó szerepel, a 2. modellben kimarad a munkanelkarany, a 3. modellben kimarad a felsofoku. A táblázat második oszlopában ahol % érték van, az azt jelenti, hogy azoknak a modelleknek, ahol ez a változó szerepel, mennyi a részvételi valószínűségek összege.
A három modellben kapott paraméterbecsléseket a modell részvételi valószínűségével súlyozottan átlagoljuk, és így kapjuk a paraméter BMA becslését. Ez általában közel van az 1. modellbeli értékekhez (hiszen ennek a súlya 80%) , de pl. az AGE:GENDER interakció referencia-cellájánál kissé eltér. Az eljárás neves népszerűsítője Adrian Raftery, számos cikkben igazolta statisztikai stabilitását.