Az empirikus eloszlásfüggvény meghatározása

Legyen $ X $ egy valószínűségi változó. $ F (x) $ - az adott valószínűségi változó eloszlásfüggvénye. $ n $ kísérleteket fogunk végrehajtani egy adott valószínűségi változón azonos független feltételek mellett. Ebben az esetben $ x_1, \ x_2 \ $, ..., $ \ x_n $ értéksorozatot kapunk, amelyet kijelölésnek nevezünk.

1. definíció

A $ x_i $ ($ i = 1,2 \ $, ..., $ \ n $) minden egyes értékét változatnak nevezzük.

Az elméleti eloszlásfüggvény egyik becslése az empirikus eloszlásfüggvény.

3. definíció

A $ F_n (x) $ tapasztalati eloszlásfüggvény egy olyan függvény, amely minden $ x $ értékhez meghatározza a $ X \ esemény relatív gyakoriságát

ahol $ n_x $ a $ x $-nál kisebb opciók száma, $ n $ a minta mérete.

Az empirikus és az elméleti függvény között az a különbség, hogy az elméleti függvény határozza meg a $ X esemény valószínűségét

Az empirikus eloszlásfüggvény tulajdonságai

Tekintsük most az eloszlásfüggvény néhány alapvető tulajdonságát.

    A $ F_n \ left (x \ right) $ függvény értéktartománya a $$ szegmens.

    $ F_n \ left (x \ right) $ nem csökkenő függvény.

    $ F_n \ left (x \ right) A $ balra folytonos függvény.

    $ F_n \ left (x \ right) $ darabonként állandó függvény, és csak a $ X $ valószínűségi változó értékeinek pontjain növekszik

    Legyen $ X_1 $ a legkisebb és $ X_n $ a legnagyobb lehetőség. Ekkor $ F_n \ bal (x \ jobb) = 0 $ $ (x \ le X) _1 $ és $ F_n \ bal (x \ jobb) = 1 $ $ x \ ge X_n $ esetén.

Vezessünk be egy tételt, amely összeköti az elméleti és az empirikus függvényeket.

1. tétel

Legyen $ F_n \ left (x \ right) $ az empirikus eloszlásfüggvény, és $ F \ left (x \ right) $ az általános minta elméleti eloszlásfüggvénye. Ekkor az egyenlőség érvényesül:

\ [(\ mathop (lim) _ (n \ to \ infty) (| F) _n \ bal (x \ jobb) -F \ bal (x \ jobb) | = 0 \) \]

Példák az empirikus eloszlásfüggvény megtalálásának problémáira

1. példa

Legyen a minta eloszlása ​​táblázat segítségével rögzítve a következő adatokkal:

1. kép

Keresse meg a minta méretét, készítsen empirikus eloszlásfüggvényt és ábrázolja azt.

Mintaméret: n $ = 5 + 10 + 15 + 20 = 50 $.

Az 5. tulajdonság szerint $ x \ le 1 $ F_n \ left (x \ right) = 0 $ esetén, és $ x> 4 $ $ F_n \ left (x \ right) esetén = 1 $.

A $ x értéke

A $ x értéke

A $ x értéke

Így kapjuk:

2. ábra.

3. ábra.

2. példa

Oroszország középső részének városaiból véletlenszerűen választottak ki 20 várost, amelyekre vonatkozóan a következő adatokat kaptuk a tömegközlekedési utazás költségeiről: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12 , 15, 14, 15, 13, 13, 12, 12, 15, 14, 14.

Készítsen empirikus eloszlásfüggvényt egy adott mintára, és készítse el a gráfját.

Írjuk fel a mintaértékeket növekvő sorrendben, és számítsuk ki az egyes értékek gyakoriságát. A következő táblázatot kapjuk:

4. ábra.

Mintaméret: $ n = $ 20.

Az 5. tulajdonság szerint $ x \ le 12 $ F_n \ left (x \ right) = 0 $ esetén, és $ x > 15 $ $ F_n \ left (x \ right) esetén = 1 $.

A $ x értéke

A $ x értéke

A $ x értéke

Így kapjuk:

5. ábra.

Ábrázoljuk az empirikus eloszlást:

6. ábra.

Eredetiség: 92,12 $ \% $.

13. előadás A valószínűségi változók statisztikai becslésének fogalma

Legyen ismert az X mennyiségi jellemző gyakoriságának statisztikai eloszlása ​​Jelöljük azon megfigyelések számával, amelyeknél a jellemző értékét észlelték, x-nél kisebb, és n-en keresztül a megfigyelések összes számát. Nyilvánvalóan az X esemény relatív gyakorisága< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

Empirikus eloszlásfüggvény(a minta eloszlásfüggvénye) egy olyan függvény, amely minden x értékre meghatározza az X esemény relatív gyakoriságát.< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки.

A minta empirikus eloszlásfüggvényével ellentétben az általános sokaság eloszlásfüggvényét ún elméleti eloszlásfüggvény. A különbség ezek között a függvények között az, hogy az elméleti függvény határozza meg valószínűség események X< x, тогда как эмпирическая – relatív gyakoriság ugyanarról az eseményről.

Ahogy n növekszik, az X esemény relatív gyakorisága< x, т.е. стремится по вероятности к вероятности этого события. Иными словами

Az empirikus eloszlásfüggvény tulajdonságai:

1) Az empirikus függvény értékei a szegmenshez tartoznak

2) - nem csökkenő funkció

3) Ha a legkisebb opció, akkor = 0, ha a legnagyobb, akkor = 1.

A minta empirikus eloszlásfüggvényét az általános sokaság elméleti eloszlásfüggvényének becslésére használjuk.

Példa... Készítsünk egy empirikus függvényt a minta eloszlására:

Változatok
Frekvenciák

Keresse meg a minta méretét: 12 + 18 + 30 = 60. A legkisebb lehetőség a 2, ezért = 0 x £ 2 esetén. Az x értéke<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. Így a szükséges empirikus függvénynek a következő alakja van:

A legfontosabb tulajdonságok statisztikai értékelések

Legyen szükséges az általános sokaság néhány mennyiségi jellemzőjének tanulmányozása. Tételezzük fel, hogy elméleti megfontolásból meg lehetett állapítani melyik az eloszlásnak van jellemzője, és ki kell értékelni azokat a paramétereket, amelyek alapján meghatározzák. Például, ha a vizsgált tulajdonság normálisan oszlik el az általános populációban, akkor meg kell becsülni a matematikai elvárásokat és a szórást; ha a jellemző Poisson-eloszlású, akkor szükséges az l paraméter becslése.

Általában csak mintaadatok állnak rendelkezésre, például n független megfigyelés eredményeként kapott mennyiségi jellemző értékei. Független valószínűségi változóknak tekintve azt mondhatjuk egy elméleti eloszlás ismeretlen paraméterének statisztikai becslésének megtalálása azt jelenti, hogy megtaláljuk a megfigyelt valószínűségi változók függvényét, amely a becsült paraméter közelítő értékét adja meg. Például egy normális eloszlás matematikai elvárásának becsléséhez egy függvény szerepét a számtani átlag játssza.



Ahhoz, hogy a statisztikai becslések helyes közelítést adhassanak a becsült paraméterekről, bizonyos követelményeknek meg kell felelniük, amelyek közül a legfontosabbak a követelmények. elfogulatlanság és következetesség becslések.

Legyen az elméleti eloszlás ismeretlen paraméterének statisztikai becslése. Találjunk egy becslést egy n méretű mintára. Ismételjük meg az élményt, i.e. az általános sokaságból kivonunk egy másik, azonos méretű mintát, és annak adataiból eltérő becslést kapunk. A kísérletet sokszor megismételve különböző számokat kapunk. A pontszám egy valószínűségi változónak tekinthető, a számok pedig annak lehetséges értékei.

Ha a becslés hozzávetőleges értéket ad bőségesen, azaz minden szám nagyobb, mint a valódi érték, akkor ennek következtében a valószínűségi változó matematikai elvárása (átlagértéke) nagyobb, mint:. Hasonlóképpen, ha megadja a becslést hátránnyal, azután .

Így egy olyan statisztikai becslés alkalmazása, amelynek matematikai elvárása nem egyenlő a becsült paraméterrel, szisztematikus (egyjegyű) hibákhoz vezetne. Ha éppen ellenkezőleg, akkor ez garantálja a szisztematikus hibákat.

Elfogulatlan statisztikai becslésnek nevezzük, amelynek matematikai elvárása megegyezik a becsült paraméterrel bármely mintaméret esetén.

Kitelepített olyan becslés, amely nem felel meg ennek a feltételnek.

A becslés torzítatlansága még nem garantálja, hogy a becsült paraméter jó közelítését kapjuk, mivel a lehetséges értékek nagyon szétszórt átlaga körül, azaz. szórás szignifikáns lehet. Ebben az esetben például egy minta adataiból kapott becslés kiderülhet, hogy jelentősen távol áll az átlagtól, és így magától a becsült paramétertől.

Hatékony egy statisztikai becslés, amely adott n mintaméret esetén rendelkezik lehető legkisebb szórás .

Ha nagy méretű mintákat veszünk figyelembe, a követelmény a statisztikai becslésekre vonatkozik következetesség .

Gazdag egy statisztikai becslés, amely n® ¥ esetén a becsült paraméter valószínűségére hajlik. Például, ha a torzítatlan becslés szórása nullára hajlik, mint n® ¥, akkor ez a becslés is konzisztens.

Az empirikus eloszlásfüggvény meghatározása

Legyen $ X $ egy valószínűségi változó. $ F (x) $ - az adott valószínűségi változó eloszlásfüggvénye. $ n $ kísérleteket fogunk végrehajtani egy adott valószínűségi változón azonos független feltételek mellett. Ebben az esetben $ x_1, \ x_2 \ $, ..., $ \ x_n $ értéksorozatot kapunk, amelyet kijelölésnek nevezünk.

1. definíció

A $ x_i $ ($ i = 1,2 \ $, ..., $ \ n $) minden egyes értékét változatnak nevezzük.

Az elméleti eloszlásfüggvény egyik becslése az empirikus eloszlásfüggvény.

3. definíció

A $ F_n (x) $ tapasztalati eloszlásfüggvény egy olyan függvény, amely minden $ x $ értékhez meghatározza a $ X \ esemény relatív gyakoriságát

ahol $ n_x $ a $ x $-nál kisebb opciók száma, $ n $ a minta mérete.

Az empirikus és az elméleti függvény között az a különbség, hogy az elméleti függvény határozza meg a $ X esemény valószínűségét

Az empirikus eloszlásfüggvény tulajdonságai

Tekintsük most az eloszlásfüggvény néhány alapvető tulajdonságát.

    A $ F_n \ bal (x \ jobb) függvény értéktartománya $ - szakasz $$.

    $ F_n \ left (x \ right) $ nem csökkenő függvény.

    $ F_n \ left (x \ right) A $ balra folytonos függvény.

    $ F_n \ left (x \ right) $ darabonként állandó függvény, és csak a $ X $ valószínűségi változó értékeinek pontjain növekszik

    Legyen $ X_1 $ a legkisebb és $ X_n $ a legnagyobb lehetőség. Ekkor $ F_n \ bal (x \ jobb) = 0 $ $ (x \ le X) _1 $ és $ F_n \ bal (x \ jobb) = 1 $ $ x \ ge X_n $ esetén.

Vezessünk be egy tételt, amely összeköti az elméleti és az empirikus függvényeket.

1. tétel

Legyen $ F_n \ left (x \ right) $ az empirikus eloszlásfüggvény, és $ F \ left (x \ right) $ az általános minta elméleti eloszlásfüggvénye. Ekkor az egyenlőség érvényesül:

\ [(\ mathop (lim) _ (n \ to \ infty) (| F) _n \ bal (x \ jobb) -F \ bal (x \ jobb) | = 0 \) \]

Példák az empirikus eloszlásfüggvény megtalálásának problémáira

1. példa

Legyen a minta eloszlása ​​táblázat segítségével rögzítve a következő adatokkal:

1. kép

Keresse meg a minta méretét, készítsen empirikus eloszlásfüggvényt és ábrázolja azt.

Mintaméret: n $ = 5 + 10 + 15 + 20 = 50 $.

Az 5. tulajdonság szerint $ x \ le 1 $ F_n \ left (x \ right) = 0 $ esetén, és $ x> 4 $ $ F_n \ left (x \ right) esetén = 1 $.

A $ x értéke

A $ x értéke

A $ x értéke

Így kapjuk:

2. ábra.

3. ábra.

2. példa

Oroszország középső részének városaiból véletlenszerűen választottak ki 20 várost, amelyekre vonatkozóan a következő adatokat kaptuk a tömegközlekedési utazás költségeiről: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12 , 15, 14, 15, 13, 13, 12, 12, 15, 14, 14.

Készítsen empirikus eloszlásfüggvényt egy adott mintára, és készítse el a gráfját.

Írjuk fel a mintaértékeket növekvő sorrendben, és számítsuk ki az egyes értékek gyakoriságát. A következő táblázatot kapjuk:

4. ábra.

Mintaméret: $ n = $ 20.

Az 5. tulajdonság szerint $ x \ le 12 $ F_n \ left (x \ right) = 0 $ esetén, és $ x > 15 $ $ F_n \ left (x \ right) esetén = 1 $.

A $ x értéke

A $ x értéke

A $ x értéke

Így kapjuk:

5. ábra.

Ábrázoljuk az empirikus eloszlást:

6. ábra.

Eredetiség: 92,12 $ \% $.

Mintaátlag.

Vegyünk egy n térfogatú mintát az általános sokaság tanulmányozásához az X mennyiségi attribútum tekintetében.

A minta átlagát a minta sokaság attribútumának számtani átlagának nevezzük.

Minta szórása.

A mintaértékek mennyiségi jellemzőinek az átlagérték körüli szórásának megfigyelésére egy összefoglaló jellemzőt vezetünk be - a minta varianciáját.

A szelektív variancia a jellemző megfigyelt értékeinek átlagától való eltérésének négyzeteinek számtani átlaga.

Ha a kiválasztási jellemző minden értéke eltérő, akkor

Korrigált szórás.

A minta variancia az általános variancia torzított becslése, azaz. a minta variancia matematikai elvárása nem egyenlő a becsült általános varianciával, de igen

A minta szórásának korrigálásához elegendő azt egy törttel megszorozni

Szelektív korrelációs együttható képlettel találjuk meg

hol vannak az értékek minta szórása és.

A minta korrelációs együtthatója a és közötti lineáris kapcsolat szorosságát mutatja: minél közelebb áll az egyhez, annál erősebb a lineáris kapcsolat és között.

23. A frekvenciák sokszöge olyan vonallánc, amelynek szakaszai pontokat kötnek össze. Frekvenciapoligon felépítéséhez az opciókat az abszcissza tengelyre, a hozzájuk tartozó frekvenciákat pedig az ordinátatengelyre fektetjük, a pontokat pedig vonalszakaszokkal kötjük össze.

A relatív frekvenciák sokszöge ugyanígy van megszerkesztve, azzal a különbséggel, hogy a relatív gyakoriságokat az ordinátán ábrázoljuk.

A gyakorisági hisztogram téglalapokból álló lépcsőzetes ábra, melynek alapja h hosszúságú részintervallumok, magasságai pedig egyenlőek az arányokkal. Az abszcissza tengelyen lévő frekvenciák hisztogramjának felépítéséhez részintervallumokat ábrázolunk, és felettük az abszcissza tengellyel párhuzamos szegmenseket húzunk távolságban (magasságban). Az i-edik téglalap területe egyenlő a frekvenciák összegével, az i-o intervallum változatával, ezért a frekvenciák hisztogramjának területe egyenlő az összes frekvencia összegével, azaz. minta nagysága.

Empirikus eloszlásfüggvény

ahol n x- a mintavételezett értékek száma kisebb, mint x; n- minta nagysága.

22 Határozzuk meg a matematikai statisztika alapfogalmait!

.A matematikai statisztika alapfogalmai. Általános sokaság és minta. Variációs sorozatok, statisztikai sorozatok. Csoportosított minta. Csoportosított statisztikai sorozatok. Frekvenciák sokszöge. Mintavételezett eloszlásfüggvény és hisztogram.

Általános népesség- az elérhető objektumok teljes halmaza.

Minta- az általános sokaságból véletlenszerűen kiválasztott objektumok halmaza.

Növekvő sorrendben írt változatok sorozatát hívjuk variációs következő, és az opciók listája és a hozzájuk tartozó frekvenciák vagy relatív gyakoriságok - statisztikai sorozat: az általános lakosságból válogatott tea.

Poligon a frekvenciákat szaggatott vonalnak nevezzük, melynek szakaszai összekötik a pontokat.

Frekvencia hisztogram téglalapokból álló lépcsőzetes alakzatnak nevezzük, amelynek alapja h hosszúságú részintervallumok, és a magasságok egyenlők az arányokkal.

Minta (empirikus) eloszlásfüggvény hívja meg a függvényt F*(x), amely minden egyes értékre meghatározza x az esemény relatív gyakorisága x< x.

Ha valamilyen folytonos jellemzőt vizsgálunk, akkor a variációs sorozat állhat egy nagyon egy nagy szám számok. Ebben az esetben kényelmesebb a használata összevont minta... Ennek eléréséhez azt az intervallumot, amelyben a jellemző összes megfigyelt értéke be van zárva, több egyenlő hosszúságú részintervallumra osztjuk. h, majd keresse meg az egyes részintervallumokhoz n i- a beesett változat frekvenciáinak összege én th intervallum.

20. A nagy számok törvényét nem szabad a nagy számokhoz kapcsolódó egyetlen általános törvényként értelmezni. A nagy számok törvénye több tétel általánosított neve, amelyből az következik, hogy a kísérletek számának korlátlan növekedésével az átlagértékek bizonyos állandókhoz hajlanak.

Ide tartoznak Csebisev és Bernoulli tételei. Csebisev tétele a nagy számok legáltalánosabb törvénye.

A tételek bizonyítása, amelyet a „nagy számok törvénye” kifejezés egyesít, Csebisev-egyenlőtlenségén alapul, amely szerint megállapítják a matematikai elvárásától való eltérés valószínűségét:

19 Pearson-eloszlás (chi - négyzet) - egy valószínűségi változó eloszlása

ahol a valószínűségi változók X 1, X 2, ..., X n függetlenek és azonos eloszlásúak N(0,1). Sőt, a kifejezések száma, pl. n a khi-négyzet eloszlás „szabadságfokainak száma”.

A khi-négyzet eloszlást a variancia becslésére (konfidenciaintervallum használatával), az egyezés, homogenitás, függetlenség hipotéziseinek tesztelésekor használjuk,

terjesztés t Student-féle t egy valószínűségi változó eloszlása

ahol a valószínűségi változók Ués x független, U szabványos normál eloszlású N(0,1), és x- chi eloszlás - négyzet n szabadsági fokokat. Ahol n a Student-eloszlás „szabadságfokainak száma”.

A matematikai elvárások, a becsült érték és egyéb jellemzők konfidencia-intervallumok segítségével történő kiértékelésére használják, a matematikai elvárások értékére vonatkozó hipotézisek, regressziós együtthatók,

A Fisher-eloszlás egy valószínűségi változó eloszlása

A Fisher-eloszlás a modell megfelelőségére vonatkozó hipotézisek tesztelésére szolgál a regressziós elemzésben, a varianciaegyenlőségről és az alkalmazott statisztika egyéb problémáiban.

18Lineáris regresszió egy statisztikai eszköz a jövőbeli árak előrejelzésére múltbeli adatok alapján, és gyakran használják annak meghatározására, amikor az árak túlmelegedtek. A legkisebb négyzetek módszerét használják a „legjobban illeszkedő” egyenes ábrázolására árpontok sorozatán keresztül. A bemenetként használt árpontok a következő értékek bármelyike ​​lehet: nyitás, zárás, magas, alacsony,

17. A kétdimenziós valószínűségi változó két valószínűségi változó rendezett halmaza ill.

Példa: Két kockával dobunk. - az első és a második kockán elesett pontok száma

A kétdimenziós valószínűségi változó eloszlási törvényének meghatározásának univerzális módja az eloszlásfüggvény.

15.m.o Diszkrét valószínűségi változók

Tulajdonságok:

1) M(C) = C, C- állandó;

2) M(CX) = CM(x);

3) M(X 1 + X 2) = M(X 1) + M(X 2), ahol X 1, X 2- független valószínűségi változók;

4) M(X 1 X 2) = M(X 1)M(X 2).

A valószínűségi változók összegének matematikai elvárása megegyezik matematikai elvárásaik összegével, azaz.

A valószínűségi változók különbségének matematikai elvárása megegyezik a matematikai várakozásaik különbségével, azaz.

A valószínűségi változók szorzatának matematikai elvárása megegyezik matematikai elvárásaik szorzatával, azaz.

Ha egy valószínűségi változó összes értékét növeljük (csökkentjük) ugyanazzal a C számmal, akkor a matematikai elvárása ugyanennyivel nő (csökken)

14. Exponenciális(exponenciális)elosztási törvény x exponenciális (exponenciális) eloszlási törvénye λ> 0 paraméterrel, ha a valószínűségi sűrűsége a következő:

Várható érték: .

Diszperzió:.

Az exponenciális eloszlási törvény fontos szerepet játszik a sorelméletben és a megbízhatóságelméletben.

13. A normál eloszlási törvényt az a (t) hibaarány vagy a meghibásodások valószínűségi sűrűsége f (t) alakja jellemzi:

, (5.36)

ahol σ az SV szórása x;

m x- SV matematikai elvárása x... Ezt a paramétert gyakran a szórás középpontjának vagy az MW legvalószínűbb értékének nevezik. x.

x- egy valószínűségi változó, amely felvehető időnek, áramértéknek, elektromos feszültség értéknek és egyéb argumentumnak.

A normál törvény egy kétparaméteres törvény, amihez ismerni kell m xés σ.

A normál eloszlást (Gauss-eloszlást) arra használjuk, hogy értékeljük azoknak a termékeknek a megbízhatóságát, amelyeket számos véletlenszerű tényező befolyásol, amelyek mindegyike jelentéktelen mértékben befolyásolja az eredő hatást.

12. Egységes elosztási törvény... Folyamatos valószínűségi változó x egységes elosztási törvénye van a szegmensre [ a, b], ha a valószínűségi sűrűsége állandó ezen az intervallumon, és azon kívül egyenlő nullával, azaz

Kijelölés:.

Várható érték: .

Diszperzió:.

Véletlenszerű érték x egy szakaszon egyenletesen eloszló ún véletlen szám 0-tól 1-ig. Forrásanyagként szolgál bármely eloszlási törvény szerinti valószínűségi változók megszerzéséhez. Az egységes eloszlási törvényt a numerikus számítások elvégzésekor a kerekítési hibák elemzésében, a sorbaállási problémák egy részében, az adott eloszlás alá tartozó megfigyelések statisztikai modellezésében alkalmazzák.

11. Meghatározás. Az eloszlás sűrűsége Egy folytonos X valószínűségi változó valószínűségét függvénynek nevezzük f (x) Az F (x) eloszlásfüggvény első deriváltja.

Az eloszlási sűrűséget is nevezik differenciál funkció... Egy diszkrét valószínűségi változó leírásához az eloszlássűrűség elfogadhatatlan.

Az eloszlássűrűség jelentése az, hogy megmutatja, milyen gyakran jelenik meg egy X valószínűségi változó a pont valamely környezetében. x a kísérletek megismétlésekor.

Az eloszlásfüggvények és az eloszlássűrűség bemutatása után a következő definíciót adhatjuk a folytonos valószínűségi változóra.

10. A valószínűségi sűrűség, egy x valószínűségi változó valószínűségi eloszlási sűrűsége olyan p (x) függvény, hogy

és bármely a< b вероятность события a < x < b равна
.

Ha p (x) folytonos, akkor elég kicsi ∆x esetén az x egyenlőtlenség valószínűsége< X < x+∆x приближенно равна p(x) ∆x (с точностью до малых более высокого порядка). Функция распределения F(x) случайной величины x, связана с плотностью распределения соотношениями

és ha F (x) differenciálható, akkor