Ugrás a tartalomhoz

Társadalomstatisztika

Németh Renáta, Simon Dávid

ELTE

Hisztogram (histogram)

Hisztogram (histogram)

Intervallum-arányskála mérési szintű változókra.

A kategorizált változó egyes kategóriáihoz tartozó gyakoriságokat (vagy relatív gyakoriságokat százalékokkal) mutatja.

(Emlékezzünk a 3. előadásban elhangozott kategorizálási problémákra, a „Magas mérési szintű változók gyakorisági táblája” fejezetben az osztályozási lehetőségekre).

Az alábbi hisztogram a magyar válaszadók között mutatja a heti átlagos munkaidő megoszlását (órában mérve), 5 órás kategóriákat használva, az y tengelyen a kategóriák gyakorisági eloszlását mutatva. Értelmezzük az ábrát. Melyik a leggyakoribb munkaidő-kategória?

Kep42

Különbségek az oszlopdiagramhoz képest:

  1. az egyes oszlopok összeérnek a mérési szintből fakadó folytonosság miatt,

  2. az oszlopdiagram esetén lehetőség van csoportok összehasonlítására ugyanazon ábrán belül, a hisztogram esetén viszont külön-külön kell ábrázolnunk az egyes csoportokat,

  3. a hisztogram esetében az oszlopok szélessége a kategória szélességével arányos, területük a kategória (százalékos) gyakoriságával. Azonos oszlopszélességnél az oszlopok magassága is a (százalékos) gyakorisággal arányos.

Az alábbi hisztogramok lehetővé teszik az összehasonlítást a japán és a holland munkavállalókkal. A kategóriák szélessége azonos, 5 (óra), így az oszlopok szélessége is azonos.

Interpretáljuk az ábrát! Melyik országban a legegységesebb a munkaidő? Melyik országban fordulhatnak elő inkább részmunkaidős állások? Hol követelnek a munkaadók legnagyobb arányban túlórát?

Kep43

FIGYELEM:

Általános probléma magas mérési szintű változók esetén:

minél finomabb beosztással definiáljuk a kategóriákat, annál egyenetlenebb gyakorisági képet kapunk, annál gyakoribb az üres kategóriák jelenléte, pusztán a mintánk véletlen voltából fakadó „esetlegességek” miatt.

(Kitérő: a körülbelüli magyarázat az, hogy a populációs megoszlás általában „sima”, de a minta ezt nem tükrözi teljes hűséggel: a kisebb létszámú kategóriák százalékos megoszlása arányaiban várhatóan jobban eltér a valós populációs megoszlástól, mint a nagy létszámú kategóriák megoszlása. A háttérben ugyanaz áll, mint a nagyobb minta jobb populációs illeszkedése mögött)

Példa:

A holland adatokat bemutató hisztogram háromféle felbontásban, az y tengelyen a mintabeli gyakorisággal:

Kep44

Osztásköz= 10 óra

Kep45

Osztásköz= 5 óra

Kep46

Osztásköz= 2 óra