Prof. Dr. Závoti József (2010)
Nyugat-magyarországi Egyetem
A matematikai statisztika a véletlen tömegjelenségek statisztikai törvény-szerű-ségeit vizsgálja.
A statisztika egyszerűbb problémáit a leíró statisztika keretein belül lehet kezelni:
Adatok ábrázolása
Grafikonok szerkesztése
Táblázatok készítése
Egyszerű paraméterek számolása (átlagértékek, szóródás)
Indexszámítás
Koncentráció-számítás
A matematikai statisztika gyakorlati használhatósága a valószínűségszámítás elméleti alapjain nyugszik. Minőségellenőrzés során sokszor nincs mód a teljes sokaságot átvizsgálni, hanem csak egy n-elemű minta alapján kell következtetéseket levonnunk. A mintaelemekből célszerű olyan függvényeket konstruálni, amelyek jó információt nyújtanak az egész eloszlásra. Tapasztalati adatokból, u.n. mintából következtetünk események valószínűségeire, vagy valószínűségi változók ismeretlen eloszlás-és sűrűségfüggvényeire.
A statisztika másik nagy területe az induktív statisztika (következtetéses statisztika):
Becslések
Tesztek
Döntéselmélet
Többváltozós statisztikai módszerek
A statisztika felhasználási területe az extrapoláció (predikció): A jelenlegi adatok alapján a jövőre nézve statisztikai prognózisokat lehet készíteni, feltételezve, hogy a feltételek azonosak maradnak. Ilyen prognózisok készülnek a következő évi energia felhasználásra, az adóbevételre, a népességszám alakulására, a munkanélküliségre, stb.
Az adatok forrása szerint megkülönböztetünk:
hivatalos statisztikai adatokat, amelyeket a Központi Statisztikai Hivatal (KSH) évkönyvben, folyóiratokban tesz közzé
nem hivatalos statisztikai adatokat, ilyenek az ipari és kereskedelmi kamarák jelentései, a különböző közvélemény-kutató intézetek felmérései, a nagy vállalatok mérlegei.
A statisztikai adatfeldolgozás lépései:
Tervezés
Mintavétel (elsődleges - másodlagos)
Kérdőív: olcsó – de általában kevés jön vissza
Interjú:drága – kvalifikált személyek szükségesek a felméré-sekhez
Megfigyelés: pl. forgalomszámlálás
Kísérlet: pl. a közgazdaságtanban az áruteszt
Automatikus rögzítés: vonalkódok a bevásárlóközpontokban vagy a telefonközpontok működése
Előkészítés: táblázat – grafikon szerkesztése
Analízis: matematikai statisztikai módszerek bevetése
Interpretáció: eredmények értékelése
Alapadatok: Sokaság (populáció)
Pl.: egy cég számlái 2009. szeptember 10-én, halálos balesetek száma 2008-ban
Sokaság: a vizsgálat tárgyát képező egységek összessége.
Csoportosítási lehetőségek:
Álló (időpont) és mozgó (időtartam) sokaság:
Pl.: Álló sokaság:
Magyarország lakossága 2000 jan. 1.
Raktár állománya 2009 szept. 10.
Pénztári bevétel 2009 szept. 10.
Mozgó sokaság
Születések száma 1 év alatt
Egy bankba 1 nap alatt befizetett csekkek
Aggregált sokaság: Különböző fajta, minőségileg eltérő, de együtt vizsgált elemek
Aggregátum: értékben megadott mennyiség. Pl. húsfogyasztás 2009-ben.
Alapsokaságot és részsokaságot (például mintavétel).
Például: Magyarország összes háztartása mennyi mosóport használ?
Definíció:
Ismérvek (karakterisztikus tulajdonságok): olyan vizsgálati szempontok, amelyek alapján egy sokaság át nem fedő részekre bontható.
Példa:
Ismérvek fajtái:
időbeli
területi
minőségi
mennyiségi.
Nominális skála: nincs természetes sorrend, mellérendeltség
Pl.: vallások, nemek, színek
Ordinális (Rang, sorrendi) skála: van sorrend, létezik rendezés
Pl.: iskolai jegyek, futball bajnokság
Intervallum skála: nullpont választása önkényes
Pl.: hőmérséklet (20°C≠2 · 10°C), időszámítás
Arány skála: létezik abszolút 0 pont
Pl.: magasság, kor, jövedelem
Az adatokat transzformációnak vethetjük alá úgy, hogy a meglévő viszonyok nem változnak.
Megkülönböztethetünk diszkrét és folytonos ismérv adatokat.
Diszkrét ismérv pl.: hallgatók száma, üzem dolgozói.
Folytonos ismérv: egy asztal hossza, súly stb.
Becsléselmélet: A valószínűségi eloszlások jellemzői mennyiségeinek meghatározását paraméterbecslésnek nevezzük.
Példa: a mintában található selejtarány alapján következtetünk az egész sokaságban valószínűsíthető selejtszámra.
Hipotézisvizsgálat: A valószínűségi változó eloszlására feltevéseket teszünk, azaz statisztikai hipotézist állítunk fel és matematikai statisztikai módszerekkel döntünk a hipotézis elfogadásáról vagy elvetéséről.
Példa: Egy adott gyártási technológia során meghatároztuk a gyártást jellemző paramétereket. Bizonyos idő elteltével azonban ellenőriznünk kell, hogy a gyártási feltételek megváltoztak-e vagy sem, azaz a paraméterek megegyeznek-e a korábbi értékekkel.
Konfidencia intervallum becslés: Mivel a becsléssel kapott érték általában nem azonos a keresett elméleti értékkel, ezért műszaki biztonsági okokból szükséges, hogy alsó és felső határt adjunk meg a becsült paraméterre.
Példa: a mintaátlag körül nagy valószínűséggel milyen intervallumban található az elméleti várható érték.
Illeszkedésvizsgálat: adott mintabeli eloszlásfüggvény milyen elméleti eloszlásfüggvényhez illeszkedik kielégítően.
Homogenitásvizsgálat: Állítható-e két valószínűségi változóról, hogy egyforma eloszlású?
Korrelációanalízis: mérési eredmények alapján próbáljuk eldönteni, hogy milyen összefüggés áll fenn két valószínűségi változó között.