Ugrás a tartalomhoz

Matematikai statisztikai elemzések 3., Becsléselmélet: alapfogalmak, nevezetes statisztikák, intervallum-becslés

Prof. Dr. Závoti József (2010)

Nyugat-magyarországi Egyetem

3.4 Konfidencia intervallum becslése:

3.4 Konfidencia intervallum becslése:

Legyen η egy populációt leíró valószínűségi változó. Eloszlásának egy ismeretlen paramétere ’a’, továbbá tegyük fel, hogy ismerjük az ’a’ paraméter egy torzítatlan becslésére szolgáló statisztika sűrűségfüggvényét. Jelölje ezt f(x).

Ekkor találhatunk olyan c1 és c2 valós számokat (c1 < c2), melyekre

.

Ezek alapján

ami azt jelenti, hogy a valószínűségi változó értéke valószínűséggel esik a intervallumba. Ennek megfelelően, ha tekintjük egy adott n elemű minta esetén felvett xn értéke körüli

intervallumot, akkor ez az intervallum valószínűséggel tartalmazza az értéket, azaz a becsülendő paramétert.

Ezt az intervallumot a becsülendő paraméter konfidenciaszinthez tartozó konfidenciaintervallumának hívjuk.

A konfidenciaszint értékét növelve a konfidencia intervallum hossza is növekszik. Ez azzal a veszéllyel járhat, hogy nem kapunk elég információt a becsülendő paraméter értékéről. Ha kicsire választjuk a konfidenciaszintet, akkor bár a konfidenciaintervallum kicsi lehet, de a paraméter beleesési valószínűsége is kicsi, így ez sem hordoz nagy információt. Általában a 0,95 körüli érték használatos.

Összefoglalva: intervallumbecslés során a minta alapján egy olyan intervallumot határozunk meg, amely az előre megadott valószínűséggel tartalmazza a becsülni kívánt jellemzőt. Ezt az intervallumot nevezzük konfidencia intervallumnak.

3.4.1 Konfidencia intervallum egy esemény valószínűségére

Legyen ’A’ egy η valószínűségi változóval kapcsolatos valószínűségű esemény.

Vegyünk η-ra vonatkozóan elemű mintákat.

Adjunk meg p értékére konfidenciaszinthez tartozó konfidencia-intervallumot!

A p valószínűség becslésére használjuk a relatív gyakoriság statisztikát.

Ha a mintán gA értéket vesz fel, akkor a p valószínűségre adódó konfidenciaintervallum:

.

A becslőfüggvény:

, ahol k= a kedvező esetek száma

n= az összes eset száma

Mivel n rögzített, k pedig binomiális eloszlást követ, ezért is binomiális eloszlású lesz.

Ekkor

, ahol q=1-p.

Tekintve, hogy σ2 ismeretlen, ezért az

formulával becsüljük.

Ahhoz, hogy a binomiális eloszlást normális eloszlással tudjuk közelíteni, a következő feltételnek kell teljesülnie:

Ekkor

változó standard normális eloszlású.

Így a keresett konfidencia intervallum:

,

melyre

Bizonyítás:

A konfidencia intervallumba foglalás alapelve alapján írhatjuk:

Az egyenlőtlenségeket a gyökös kifejezéssel végigszorozva:

Az egyenlőtlenségeket p paraméterre rendezve:

Vagy ami ugyanaz:

Megjegyzés:

z szimmetrikus eloszlású, vagyis

Példa:

Tekintsünk 5000 db televíziókészüléket, amelyből 80 db rossz.

Adjunk intervallumbecslést annak a valószínűségére, hogy egy televízió rossz, ha α=0,05!

Tehát a keresett konfidenciaintervallum:

, vagyis

3.4.2 Konfidencia intervallum a várható értékre

A várható értékre vonatkozó konfidenciaintervallum meghatározása során három esetet kell megvizsgálnunk:

  • σ ismert

  • σ ismeretlen és n ≥ 30 (nagy minta)

  • σ ismeretlen és n ≤ 30 (kis minta)

ahol σ a sokasági szórás.

  1. A σ szórás ismert

Ezen konfidenciaintervallum meghatározását felhasználjuk a korábbi definíciók és jelölések jelentésének elmélyítésére.

Legyen η tetszőleges valószínűségi változó μ várható értékkel és σ szórással. Tegyük fel, hogy σ ismert, és μ-re akarunk egy konfidenciaintervallumot meghatározni.

A várható értékre torzítatlan becslés az mintaközép.

Vegyünk η-ra n≥30 elemű mintákat!

Milyen eloszlású az statisztika?

Megmutatható, hogy normális eloszlású μ várható értékkel és szórással.

Most meg kell határoznunk egy intervallumot, melyre .

Az standardizálásával a következő egyenlőséget nyerjük:

.

A normális eloszlás sűrűségfüggvényének szimmetriája miatt

és ,

így a z-eloszlás táblázatából kapjuk meg őket.

Ezek szerint

és .

A c1 és c2 értékeket kifejezve

.

Ebből körüli intervallumra áttérve kapjuk a

egyenlőséget.

Innét leolvasható, hogy a becsülendő paraméter az valószínűségi változó adott mintán felvett értéke körüli

intervallumban van valószínűséggel.

Ezt az intervallumot hívjuk a normális eloszlás várható értékére vonatkozó konfidencia intervallumnak.

Feltétel: normális eloszlásból származó minta.

Mivel σ ismert, ezért a becslőfüggvény standard normális eloszlású lesz, tehát:

Ekkor az megbízhatósági szinthez tartozó konfidencia intervallum:

melyre

Bizonyítás:

A konfidencia intervallumba foglalás alapelve alapján írhatjuk:

Az egyenlőtlenségeket a gyökös kifejezéssel végigszorozva:

Az egyenlőtlenségeket paraméterre rendezve:

Vagy ami ugyanaz:

Példa:

Tekintsük a következő mintát:

Adjon intervallumbecslést a várható értékre, ha α=0,01!

Megoldás:

Tehát a keresett intervallum:

  1. A σ szórás ismeretlen, és n ≥ 30 (nagy minta)

A gyakorlatban többször fordul elő az az eset, amikor az η valószínűségi változó szórását nem ismerjük.

Ebben az esetben bizonyítható, hogy az valószínűségi változó n-1 szabadságfokú t-eloszlást követ. Az s a mintából számított korrigált tapasztalati szórás.

Ekkor a c1 és c2 értékeket a következő módon kapjuk:

Az adott konfidenciaszinthez a t táblázatból kikereshetjük a

és

értékeket. (A t eloszlás sűrűségfüggvénye páros!)

Emiatt

Azaz

Innét leolvasható, hogy a becsülendő μ paraméter az valószínűségi változó adott mintán felvett értéke körüli

intervallumban van valószínűséggel.

  1. A σ szórás ismeretlen, és n < 30 (kis minta)

Mivel σ nem ismert, ezért s2–tel becsüljük. Így a normális eloszlás helyett kénytelenek vagyunk a t– (Student) eloszlású változót használni, ν=n-1 szabadságfokkal. Ekkor:

Ekkor az 1 megbízhatósági szinthez tartozó konfidencia intervallum:

Bizonyítás:

Megjegyzés: t szimmetrikus eloszlású, vagyis

Példa:

Adott:

Adjon intervallumbecslést a várható értékre, ha

Megoldás:

A keresett intervallum:

3.4.3 Konfidencia intervallum két valószínűségi változó várható értékének különbségére

Adott az η1 és η2 valószínűségi változó. Tegyük fel, hogy ismerjük és értékét. Az η1 valószínűségi változóra vegyünk elemű mintát, az η2-re eleműt. Legyen μ1 és μ2 a két valószínűségi változó várható értéke.

Adjuk meg az konfidenciaszinthez tartozó konfidenciaintervallumot a várható értékek különbségére (azaz -re)!

Torzítatlan becslésre az statisztika használható. Ha ill. valószínűségi változó mintán felvett értéke és , akkor a nyert konfidenciaintervallum:

.

Az eddigiekben csak egyetlen sokasági jellemzőt becsültünk minta alapján, a továbbiakban áttérünk arra az esetre, amikor két sokasági jellemzőt hasonlítunk össze.

Kiindulásként feltesszük, hogy adott két sokaság, amelyeket ugyanazon ismérv szerint vizsgálunk. Elsőként a két sokasági várható érték becslésével ismerkedünk meg részletesebben. Itt is több esetet tárgyalunk:

  1. Ismert σ1 és σ2

Mivel ismertek a minták szórásai, ezért a

változó standard normális eloszlást követ.

Ekkor az megbízhatósági szinthez tartozó konfidencia intervallum:

Bizonyítás:

A megfelelő műveletek elvégzése után kapjuk a megoldást.

  1. σ1 és σ2 nem ismert, de σ1 = σ2

Amennyiben és nem ismert, úgy egy-egy mintából az és korrigált szórásnégyzetekkel becsüljük őket. Jelölje az átlagkülönbség szórására adott közelítést és υ az eloszlásának szabadságfokát.

Ekkor a következő konfidenciaintervallumot kapjuk:

.

A második esetben a sokasági szórásokat nem ismerjük. Külön-külön ugyan becsülhetők az egyes mintákból, de ekkor nem tudjuk meghatározni az intervallumbecsléshez szükséges változó eloszlását, így ez az eset kezelhetetlen. Ezért csak azt az esetet tárgyaljuk, amikor feltételezhető, hogy a két szórásnégyzet megegyezik. Ekkor a közös szórásnégyzet az alábbi formulával becsülhető:

ahol és a mintákból számított korrigált szórásnégyzetek.

Szükségünk van még a mintaátlagok különbségének szórásnégyzetére, ami a következőképpen becsülhető:

ebből a becsült standard hiba

Ezekből következik, hogy a

változó szabadságfokú t–eloszlást követ.

Ekkor az megbízhatósági szinthez tartozó konfidencia intervallum:

Bizonyítás:

A megfelelő műveletek elvégzése kapjuk a megoldást.

Példa:

Adott:

Adjon intervallumbecslést a két várható érték különbségére, ha !

Megoldás:

Tehát a keresett intervallum:

3.4.4 Konfidencia intervallum egy normális eloszlású valószínűségi változó szórásnégyzetére

Adott egy η normális eloszlású valószínűségi változó, melynek ismeretlen szórása σ. Vegyünk az η valószínűségi változóra n elemű mintákat.

Adjuk meg σ2 értékére az konfidenciaszinthez tartozó konfidencia-intervallumot! σ2 becslésére használjuk az statisztikát.

Ha mintán felvett értéke , akkor a keresett konfidenciaintervallum:

Ezt csak normális eloszlású sokaságokra alkalmazzuk, ha a sokaság eloszlása nem normális, akkor az alábbiakban bemutatásra kerülő intervallumbecslés nem alkalmazható.

Ha a sokaság normális eloszlású, akkor belátható, hogy a

változó szabadságfokú χ2 – (Khi - négyzet) eloszlást követ.

Ekkor az megbízhatósági szinthez tartozó konfidenciaintervallum:

Bizonyítás:

Megjegyzés: a χ2 – eloszlás nem szimmetrikus.

Példa:

Egy gyárban készülő konzervek közül egy 100 elemű mintát választva a konzervek tömegeire a következő értékeket kapjuk:

Tömeg (g)

Darabszám

- 240

8

240 - 245

22

245 - 250

32

250 - 255

28

255 - 260

10

Összesen:

100

Adjunk intervallumbecslést a tömeg szórásnégyzetére, ha s=5,5 ; α=0,05 és n=100!

és

és

Tehát a keresett intervallum:

3.4.5 Konfidenciaintervallum két normális eloszlású valószínűségi változó szórásnégyzetének hányadosára

Adott az η1 és η2 normális eloszlású valószínűségi változó. Ismeretlen szórásnégyzetük legyen rendre és . Az első valószínűségi változóra vegyünk n1, a másodikra n2 elemű mintát.

Adjuk meg értékére az konfidenciaszinthez tartozó konfidenciaintervallumot!

Használjuk becslésére az statisztikát.

Ha mintán felvett értéke és mintán felvett értéke , akkor a keresett konfidenciaintervallum:

Adott: és

Bizonyítható, hogy az

változó Fisher – eloszlást követ és szabadságfokkal.

Ekkor az megbízhatósági szinthez tartozó konfidencia intervallum:

Bizonyítás:

Példa:

Adott:

Adjon intervallumbecslést a szórásnégyzetek hányadosára, ha !

Megoldás:

és

Tehát a keresett intervallum: