Ugrás a tartalomhoz

Matematika III. 6., A statisztika alapfogalmai

Prof. Dr. Závoti József (2010)

Nyugat-magyarországi Egyetem

6.2 A statisztika alapfogalmai és főbb feladatai

6.2 A statisztika alapfogalmai és főbb feladatai

6.2.1 Leíró és következtetéses statisztika

A matematikai statisztika a véletlen tömegjelenségek statisztikai törvény-szerű-ségeit vizsgálja.

A statisztika egyszerűbb problémáit a leíró statisztika keretein belül lehet kezelni:

  • Adatok ábrázolása

  • Grafikonok szerkesztése

  • Táblázatok készítése

  • Egyszerű paraméterek számolása (átlagértékek, szóródás)

  • Indexszámítás

  • Koncentráció-számítás

A matematikai statisztika gyakorlati használhatósága a valószínűségszámítás elméleti alapjain nyugszik. Minőségellenőrzés során sokszor nincs mód a teljes sokaságot átvizsgálni, hanem csak egy n-elemű minta alapján kell következtetéseket levonnunk. A mintaelemekből célszerű olyan függvényeket konstruálni, amelyek jó információt nyújtanak az egész eloszlásra. Tapasztalati adatokból, u.n. mintából következtetünk események valószínűségeire, vagy valószínűségi változók ismeretlen eloszlás-és sűrűségfüggvényeire.

A statisztika másik nagy területe az induktív statisztika (következtetéses statisztika):

  • Becslések

  • Tesztek

  • Döntéselmélet

  • Többváltozós statisztikai módszerek

A statisztika felhasználási területe az extrapoláció (predikció): A jelenlegi adatok alapján a jövőre nézve statisztikai prognózisokat lehet készíteni, feltételezve, hogy a feltételek azonosak maradnak. Ilyen prognózisok készülnek a következő évi energia felhasználásra, az adóbevételre, a népességszám alakulására, a munkanélküliségre, stb.

6.2.2 A statisztikai adatok forrásai és feldolgozása

Az adatok forrása szerint megkülönböztetünk:

  • hivatalos statisztikai adatokat, amelyeket a Központi Statisztikai Hivatal (KSH) évkönyvben, folyóiratokban tesz közzé

  • nem hivatalos statisztikai adatokat, ilyenek az ipari és kereskedelmi kamarák jelentései, a különböző közvélemény-kutató intézetek felmérései, a nagy vállalatok mérlegei.

A statisztikai adatfeldolgozás lépései:

  1. Tervezés

  2. Mintavétel (elsődleges - másodlagos)

    • Kérdőív: olcsó – de általában kevés jön vissza

    • Interjú:drága – kvalifikált személyek szükségesek a felméré-sekhez

    • Megfigyelés: pl. forgalomszámlálás

    • Kísérlet: pl. a közgazdaságtanban az áruteszt

    • Automatikus rögzítés: vonalkódok a bevásárlóközpontokban vagy a telefonközpontok működése

  3. Előkészítés: táblázat – grafikon szerkesztése

  4. Analízis: matematikai statisztikai módszerek bevetése

  5. Interpretáció: eredmények értékelése

Alapadatok: Sokaság (populáció)

Pl.: egy cég számlái 2009. szeptember 10-én, halálos balesetek száma 2008-ban

6.2.3 A statisztikai sokaság

Sokaság: a vizsgálat tárgyát képező egységek összessége.

Csoportosítási lehetőségek:

  1. Álló (időpont) és mozgó (időtartam) sokaság:

Pl.: Álló sokaság:

  • Magyarország lakossága 2000 jan. 1.

  • Raktár állománya 2009 szept. 10.

  • Pénztári bevétel 2009 szept. 10.

Mozgó sokaság

  • Születések száma 1 év alatt

  • Egy bankba 1 nap alatt befizetett csekkek

  1. Aggregált sokaság: Különböző fajta, minőségileg eltérő, de együtt vizsgált elemek

Aggregátum: értékben megadott mennyiség. Pl. húsfogyasztás 2009-ben.

  1. Alapsokaságot és részsokaságot (például mintavétel).

Például: Magyarország összes háztartása mennyi mosóport használ?

6.2.4 Statisztikai ismérvek

Definíció:

Ismérvek (karakterisztikus tulajdonságok): olyan vizsgálati szempontok, amelyek alapján egy sokaság át nem fedő részekre bontható.

Példa:

Ismérvek fajtái:

  • időbeli

  • területi

  • minőségi

  • mennyiségi.

6.2.5 Statisztikai skálák, információ szintek:

  1. Nominális skála: nincs természetes sorrend, mellérendeltség

Pl.: vallások, nemek, színek

  1. Ordinális (Rang, sorrendi) skála: van sorrend, létezik rendezés

Pl.: iskolai jegyek, futball bajnokság

  1. Intervallum skála: nullpont választása önkényes

Pl.: hőmérséklet (20°C≠2 · 10°C), időszámítás

  1. Arány skála: létezik abszolút 0 pont

Pl.: magasság, kor, jövedelem

Az adatokat transzformációnak vethetjük alá úgy, hogy a meglévő viszonyok nem változnak.

6.2.6 Diszkrét és folytonos ismérv adatok

Megkülönböztethetünk diszkrét és folytonos ismérv adatokat.

Diszkrét ismérv pl.: hallgatók száma, üzem dolgozói.

Folytonos ismérv: egy asztal hossza, súly stb.

6.2.7 A matematikai statisztika fő területei:

  1. Becsléselmélet: A valószínűségi eloszlások jellemzői mennyiségeinek meghatározását paraméterbecslésnek nevezzük.

Példa: a mintában található selejtarány alapján következtetünk az egész sokaságban valószínűsíthető selejtszámra.

  1. Hipotézisvizsgálat: A valószínűségi változó eloszlására feltevéseket teszünk, azaz statisztikai hipotézist állítunk fel és matematikai statisztikai módszerekkel döntünk a hipotézis elfogadásáról vagy elvetéséről.

Példa: Egy adott gyártási technológia során meghatároztuk a gyártást jellemző paramétereket. Bizonyos idő elteltével azonban ellenőriznünk kell, hogy a gyártási feltételek megváltoztak-e vagy sem, azaz a paraméterek megegyeznek-e a korábbi értékekkel.

  1. Konfidencia intervallum becslés: Mivel a becsléssel kapott érték általában nem azonos a keresett elméleti értékkel, ezért műszaki biztonsági okokból szükséges, hogy alsó és felső határt adjunk meg a becsült paraméterre.

Példa: a mintaátlag körül nagy valószínűséggel milyen intervallumban található az elméleti várható érték.

  1. Illeszkedésvizsgálat: adott mintabeli eloszlásfüggvény milyen elméleti eloszlásfüggvényhez illeszkedik kielégítően.

  2. Homogenitásvizsgálat: Állítható-e két valószínűségi változóról, hogy egyforma eloszlású?

  3. Korrelációanalízis: mérési eredmények alapján próbáljuk eldönteni, hogy milyen összefüggés áll fenn két valószínűségi változó között.