Statistika


Variační koeficient Relativní průměrná odchylka



Yüklə 0,58 Mb.
səhifə3/18
tarix06.05.2018
ölçüsü0,58 Mb.
#43206
1   2   3   4   5   6   7   8   9   ...   18

Variační koeficient




Relativní průměrná odchylka





Charakteristiky šikmosti

Jsou založeny na srovnání koncentrace malých hodnot sledovaného znaku s koncentrací velkých hodnot tohoto znaku




koncentrace malých hodnot

=

>

<

koncentrace velkých hodnot

= symetrie rozdělení



< > nesymetrie rozdělení


Rozdělení četností souboru A

Rozdělení četností souboru B

Rozdělení četností souboru C

Obměny znaku xi

Četnosti ni

Obměny znaku xi

Četnosti ni

Obměny znaku xi

Četnosti ni

10

13

11

5

5

5

15

24

12

5

15

25

20

13

13

5

16

5







14

5

17

5







15

25

18

5







25

5

19

5

celkem

50

celkem

50

celkem

50






Stupeň šikmosti rozdělení lze posuzovat řadou charakteristik. Nejčastěji se používá „momentová charakteristika šikmosti“.



Momentová charakteristika šikmosti




a = 0 => symetrické rozdělení

a > 0 => rozdělení zešikmené doleva = kladná četnost

a < 0 => rozdělení zešikmené doprava = záporná četnost


Charakteristiky špičatosti

Založeny na srovnání stupně koncentrace hodnot prostřední velikosti se stupněm koncentrace ostatních hodnot




Rozdělení četností D

Rozdělení četností E

Obměny znaku xi

Četnosti ni

Obměny znaku xi

Četnosti ni

2

4

6



225

550


225

1

4

7



100

800


100

U obou rozdělení četností je n = 1000, = 4, = 4, = 4, s2 = 1,8 a a = 0 a přesto se soubory liší a to soustředěností (koncentrací) hodnot znaku kolem střední hodnoty.



b = 0 => normální rozdělení

b > 0 => rozdělení špičatější než normální

b < 0 => rozdělení plošší než normální



Teorie pravděpodobnosti
Je to vědní obor, který vznikl ve 2. polovině 17. století jako důsledek hazardních her a stal se oborem matematiky. Užívá se také ve fyzice a statistice.
Náhodný jev

Jev, který jako výsledek náhodného pokusu, může nebo nemusí nastat v závislosti na náhodných činitelích (nekontrolovatelných příčin). Charakterizuje výsledek náhodného pokusu kvalitativně (slovně). Značíme jej velkými písmeny ze začátku abecedy (A, B, C)


Předmětem zkoumání jsou náhodné jevy, které mohou být výsledky opakovaných realizací komplexu základních podmínek = hromadné jevy .
Krajní případy:

1. jev jistý (nastane vždy po provedení náhodného pokusu, P=1)

2. jev nemožný (nemůže nikdy nastat, P=0)
Náhodný pokus

Realizace určitého komplexu podmínek a vlivů, přičemž každý komplex obsahuje podmínky obecné (měřitelné, předvídatelné, ovlivnitelné) a podmínky náhodné.


Operace s náhodnými jevy

- mezi náhodnými jevy existují určité vztahy a lze s nimi provádět operace:



  1. sjednocení = logický součet (A  B), nastoupení alespoň jednoho z jevů A a B,
    př. A=0,7-1,5%, B=1,3-2,5%  sjednocení C= 0,7 –2,5%

  2. průnik = logický součin (A  B), současná realizace jevu A a B
    př. A  15%, B  8%  D=(8,15)

  3. rozdíl (A - B) = nastane-li A, nenastane jev B

Dále existují: jevy neslučitelné (disjunktivní) - A a B se nemohou vyskytnout současně, jevy opačné - A  Ā = U, A  Ā= V.



Pravděpodobnost (P)

Výsledek u náhodného pokusu nelze předem předpovědět, ale při mnohonásobném opakování pokusu se ve výskytu jevu objevují určité zákonitosti. S rostoucím počtem pokusů vykazuje sledovaný jev tzv. statistickou stabilitu, která umožňuje kvantitativně ohodnotit realizaci náhodného jevu. Číslo charakterizující tuto realizaci se nazývá pravděpodobnost jevu. jevu A přiřazujeme číslo P(A).


Definice pravděpodobnosti:

1. klasická



P(A) = m/n

m = počet případů vztahujících se k jevu A

n = počet všech možných případů (výsledků pokusu)

2. statistická

Je založena na stabilitě relativních četností, která vzniká po provedení velkého počtu pokusů a vede k číslu P(A) = lim N M/N

N = počet pokusů

M = počet výskytu náhodného jevu A

Vychází ze skutečných výsledků pokusu (klasická – neprovádí pokusy, ale vychází z rozboru objektivních vlastností zkoumaného jevu)

3. axiomatická

Nejobecnější definice, zahrnuje v sobě jak klasickou, tak statistickou definici.

4. geometrická
Základní vlastnosti pravděpodobnosti (P)

1. P(A)  <0,1>

2. P(U) =1  jev jistý

3. P(V) =0  jev nemožný

4. P(Ā) =1 – P(A)

5. A  B  P(A)  P(B), A je podmnožinou B


Věta o sčítání pravděpodobnosti

Pomocí této věty vyjádříme pravděpodobnost sjednocení u jevů P(A  B)



  1. slučitelné jevy – pravděpodobnost jejich sjednocení je rovna součtu pravděpodobnosti jevů zmenšenému o pravděpodobnost jejich průniku.
    P(A  B) = P(A) + P(B) - P(A  B)

  2. neslučitelné jevy – průnik je nemožný
    P(A  B) = P(A) + P(B)


Věta o násobení pravděpodobnosti

Pomocí této věty vyjádříme pravděpodobnost průniku jevů. A je nezávislý na B, jestliže výskyt B neovlivní pravděpodobnost výskytu jevu A. Závislost náhodných jevů je charakterizována pomocí podmíněné pravděpodobnosti, označované P(A/B), P(A) je nepodmíněná pravděpodobnost



  1. podmínka nezávislosti pomocí podmíněné pravděpodobnosti  P(A/B) = P(A)

  2. podmíněnou pravděpodobnost lze vyjádřit:
    P(A/B) = P(A  B) / P(B)

P(B/A) = P(A  B) / P(A)
Náhodná veličina

Kvalitativní popsání výsledku náhodného pokusu (náhodný jev) není dostatečný, výsledek je třeba popsat kvantitativně. Libovolná kvantitativní charakteristika náhodného pokusu se nazývá náhodná veličina. Proměnná, která nabývá různých hodnot v závislosti na náhodě. Značíme ji velkými písmeny z konce abecedy (X, Y, Z) a jejich konkrétní hodnoty malými (x, y, z)


Členění dle hodnot, jakých náhodná veličina může nabývat:

  1. diskrétní - nabývá navzájem oddělených hodnot z určitého konečného nebo spočetného množství (př. počet rostlin na pozemku)

  2. spojité – nabývá libovolných hodnot z určitého intervalu, může být popsána desetinným číslem (př. výška a hmotnost zvířete)

Zákon rozdělení náhodné veličiny

Pravidlo, které každé hodnotě nebo množině hodnot z každého intervalu přiřazuje pravděpodobnost, že náhodná veličina nabude této hodnoty nebo hodnoty z tohoto intervalu.


Formy vyjádření zákona:

1. řada rozdělení – nejjednodušší forma, která se používá u diskrétních veličin



xi: x1, x2 ......... xn grafem je polygon

pi: p1, p2 ......... pn

pi = 1


2. distribuční funkce(F(x))

Integrální zákon rozdělení. Univerzální forma vhodná pro popis diskrétních i spojitých náhodných veličin. Funkce, která každému reálnému číslu přiřazuje pravděpodobnost, že náhodná veličina nabude hodnoty menší než toto číslo



F(x)=P(X  x) ; x  R
Základní vlastnosti F(x):

  1. F(x) je pravděpodobnost a může nabývat hodnot v intervalu <0,1>

  2. F(-) = P(x  -) =0
    F() = P(x  ) =1

  3. funkce je neklesající funkcí  pro x1  x2 platí F(x1)  F(x2)

  4. funkce je funkcí spojitou zleva

  5. P(x1  X x2) = F(x1) - F(x2)


Graf F(x):

    1. diskrétní náhodné veličiny  nespojitá schodovitá čára

    2. spojité náhodné veličiny  spojitá křivka

3. hustota pravděpodobnosti f(x)

Diferenciální zákon rozdělení. Vhodná forma pro spojité náhodné veličiny. Derivace distribuční funkce: f(x) = F‘(x)
Graficky  plocha pod spojitou funkcí(Gaussovou) mezi x1 a x2.
Vlastnosti f(x):


  1. f(x)=0

  2. S- f(x)dx = 1

  3. P(x1  X x2) = x2Sx1 f(x)dx=1


Číselné charakteristiky náhodné veličiny

Uvedené formy zákona rozdělení poskytují sice úplnou, ale nepřehlednou informaci o rozdělení náhodné veličiny x. Tento nedostatek odstraňují tzv. číselné charakteristiky náhodných veličin, jejichž úkolem je v koncentrované formě charakterizovat podstatné rysy a vlastnosti náhodné veličiny.


Členění: charakteristiky, polohy, charakteristiky variability, charakteristiky šikmosti, charakteristiky špičatosti
Charakteristiky polohy

Reprezentují jakýsi střed rozdělení, kolem kterého kolísají při opakování náhodného pokusu hodnoty náhodné veličiny.


Střední hodnota E(x):

pro veličiny - diskrétní E(x) =  xi pi



- spojité E(x) = S- x f(x)dx
E(C) = C  střední hodnota konstanty je rovna konstantě
Charakteristiky variability

Ukazují jak jednotlivé hodnoty náhodné veličiny kolísají kolem střední hodnoty.


a) rozptyl D(x)
D(x) = E[ x - E(x) ]2 = E(x2) - [ E(x) ]2
pro veličiny - diskrétní D(x) =  [xi E(x) ]2* pi

- spojité D(x) = S- [ x - E(x) ]2 f(x)dx
b) směrodatná odchylka

(x) = +


Normovaná veličina

Náhodná veličina U, kde E(U) = 0 a D(U) = 1. Pracuje se s ní výhodněji. Libovolnou veličinu můžeme převést na U normováním: U = [ X - E(x) ] / (x)


Rozdělení náhodných veličin

Existuje několik set druhů rozdělení


Rozdělení diskrétních náhodných veličin
Alternativní rozdělení – náhodná veličina (tzv. nula-jedničková) X může nabývat pouze dvou hodnot x1=1 s pravděpodobností = p (nastává jev A) a x2=0 s pravděpodobností 1-p = q (nastává jev opačný k jevu A), pak tato veličina se řídí alternativním rozdělením se střední hodnotou E(x) = p a rozptylu D(x) = p*q
Binomické rozdělení – mějme sérii n nezávislých pokusů, při nichž může nastat jev A s P(A) = p a nenastane s pravděpodobností = 1-p. Tzv. Bernoulliho schéma. Náhodná veličina X má binomické rozdělení s parametry n a p.

pi = P(X=i) = (n) p i (1-p) n-1 - pravděpodobnost, že jev A nastane, kde i = 0,1,.....n

E(x) = np ; D(x) = np(1-p)
Poissonovo rozdělení = zákon vzácných jevů. Jestliže n   a p  0 (pravděpodobnost úspěchu je malá), přičemž np je konstantní hodnota, pak náhodná veličina X se řídí Poissonovým rozdělením s parametrem , kde λ = np, potom , kde i=0,1.....n.

E(x) = λ ; D(x)= λ  E(x) = D(x). Lze jím nahradit rozdělení binomické.

Hypergeometrické rozdělení - V souboru N prvků má M prvků určitou vlastnost; počet prvků náhodně vybraných je n (parametry N, M, n)
Pravděpodobnost:

E(x) = np, kde p = M/N

D(x) = np*(1-p)* [(N-n) / (N-1)]
Rozdělení spojitých náhodných veličin
Normální rozdělení(Gaussovo) - náhodná veličina X s parametry µ a 2, kde µ є (- ; ) a 2>0, se řídí normálním rozdělením, jestliže její hustota pravděpodobnosti:


Grafem f(x) normálního rozdělení je Gaussova (normální) křivka symetrická spojitá čára; křivka nabývá svého maxima v bodě µ, max=µ=E(x) a má 2 inflexní body: µ+  a µ - 
D(x)= 2
Při klasických výpočtech se využívá transformace náhodné veličiny X s normálním rozdělením do veličiny U s normovaným normálním rozdělením.
Normované normální rozdělení = speciální případ normálního rozdělení, kde µ=0 a 2=1

X...........N(µ,2)

U...........N(0,1)  nula-jedničkové rozdělení

XU......... U= (x-µ) / 
S normálním rozdělením souvisí pravidlo tří :

  1. P( µ-  x  µ+) = 0,68268

  2. P( µ-2  x  µ+2) = 0,95450:

  3. P( µ-3  x  µ+3) = 0,99730


Rovnoměrné rozdělení

Parametry: a, b


E(x) = (a+b) / 2

D(x) = (b-a)2 / 12

f(x) = 1 / (b-a)

F(x) = (x-a) / (b-Q)
Exponenciální rozdělení

Parametr: λ



E(x) = 1 / λ D(x) = 1 / λ2

f(x): pro x 0 = λ*e-λx

x0 = 0

F(x): pro x 0 = 1-e-λx

x0 = 0
Pearsonovo 2 – rozdělení - nechť U1, U2, ...........Un jsou nezávislé náhodné veličiny s rozdělením N(0,1). Součet jejich čtverců, označený 2 = U12+ U22, ..........+Un2 představuje náhodnou veličinu, jež má tzv. 2 – rozdělení o n stupních volnosti.
Počet stupňů volnosti (f) = jediný parametr 2 rozdělení a představuje počet nezávislých sčítanců ve výrazu 2 .
Hustota pravděpodobnosti náhodné veličiny 2 má pro různé počty stupňů volnosti různý průběh
Studentovo t-rozdělení - nechť U a 2 jsou nezávislé náhodné veličiny t, z nichž U má rozdělení N(0,1) a veličina 22 rozdělení o n stupních volnosti (n....jediný parametr)
Kritické hodnoty t jsou tabelovány (stejně jako hodnoty 2)

Fischerovo – Suedecovo rozdělení (F-rozdělení) - rozdělení náhodné veličiny


21 a 22 = nezávislé náhodné veličiny, jež mají 2 – rozdělení o n1 či n2 stupních volnosti


Teorie odhadu
Na základě zkoumání náhodného výběru lze učinit určité závěry o základním souboru. Souhrn metod, jež toto srovnání umožňuje se označuje statistická indukce, a ta se dále člení na teorii odhadu a testování statistických hypotéz.
Úloha teorie odhadu  určení typu rozdělení sledovaného znaku, respektive některých charakteristik, a to na základě výběrových dat.
Výběrový soubor

Použijeme ho, aby nám poskytl informace o celém základním souboru. Z vlastností výběrového souboru můžeme usuzovat o vlastnostech základního souboru. Zjišťování u VS je rychlejší a méně nákladné. Důvody, které nás vedou k upřednostňování výběrového zjišťování před zjišťováním u ZS jsou technické, ekonomické a časové.)


Kvalitní VS musí dobře zastupovat skupinu, nemusí být příliš velký. Musíme u něho hledat kompromis mezi dobrou vypovídací schopností a dobrou zpracovatelností.
Př. Dotazníky – důležité pro zjišťování veřejného mínění, většinou u 1000 osob. Návratnost dotazníků od určitého okruhu osob je 12 – 14%. Těchto 12 – 14% nám vytvoří VS.
Metody základního masivu

Použijeme je tehdy, pokud se soubor skládá z několika velkých (rozhodujících) jednotek a z mnoha malých (nerozhodujících či doplňkových) jednotek. Stačí vybrat pouze rozhodující jednotky.


Výběr záměrný - vybíráme s určitým záměrem. Provádí ho znalec dané problematiky = subjektivní výběr (vliv názoru znalce). Na základě tohoto výběru nelze pořizovat objektivně přesné odhady.
Výběr náhodný - spočívá v tom, že o tom, která jednotka bude zařazena do VS rozhoduje náhoda. Zmocňujeme se výhodných stránek náhody a na základě náhodného výběru jsme schopni stanovit objektivně přesné odhady a také jsme schopni určit chybu odhadu. Počítáme s chybou x v záměrném výběru může být chyba skrytá  vždy dáváme přednost náhodnému výběru.


  1. prostý náhodný výběr – výběr se stejnými pravděpodobnostmi, všechny jednotky mají stejnou možnost dostat se do VS. Nejčastější, technicky nejjednodušší.

  2. náhodný výběr s nestejnými pravděpodobnostmi – jednotky mají různou pravděpodobnost vybrání


Další členění náhodného výběru:

  1. náhodný výběr z jednorozměrného rozdělení – na každé statistické jednotce zjišťujeme pouze jeden statistický znak

  2. náhodný výběr z vícerozměrného rozdělení – na každé statistické jednotce zjišťujeme hodnoty k statistických znaků


Členění (prostého) náhodného výběru:

  1. náhodný výběr s vracením, s opakováním – jednotku vracíme po výběru zpět do ZS. Nevýhoda: může se opakovat stejná jednotka několikrát. Výhoda: ZS je stále stejně velký.

  2. náhodný výběr bez vracení, bez opakování – jednotku po výběru nevracíme zpět do ZS. Nevýhoda: ZS je stále menší. Výhoda: jednotka se nemůže opakovat. V některých případech lze zanedbat rozdíly mezi a) a b) např. velké množství rostlinných semen.


Techniky náhodného výběru

  1. losování - nejjednodušší technika (z osudí, klobouku, čepice), lístky – opora výběru, musí být všechny naprosto stejné

  2. mechanický (systematický) výběr - vybíráme n-tou jednotku z náhodně uspořádané posloupnosti. Např. z abecedního seznamu vybereme každého 10. studenta.

  3. tabulka náhodných čísel, generátor náhodných čísel

  4. oblastní výběr - nejprve náhodně vybereme oblasti a potom budeme náhodně vybírat jednotky ve vybrané oblasti

  5. výběr vícestupňový - vybíráme náhodně na více stupních. Např. škola: 1. stupeň – zda je v Praze, 2. stupeň – konkrétní škola, 3. stupeň – fakulta.



Problematika charakteristik 

Z VS spočítáme charakteristiky a na jejich základě odhadujeme charakteristiky ZS.


1. rozsah

  1. VS........n

  2. ZS........N

2. absolutní četnost

  1. VS........ni

  2. ZS........Ni

3. relativní četnost

  1. VS........fi

  2. ZS........Fi

4. aritmetický průměr

  1. VS........ = (xi) / n

  2. ZS........ µ = (xi) / N

5. rozptyl

  1. VS........so2 = (xi x)2 / n

  2. ZS........2 = (xi – µ)2 / N

6. směrodatná odchylka

  1. VS........so

  2. ZS........

7. variační koeficient

  1. VS........V = so /

  2. ZS........V =  / µ

Veškeré informace o VS bychom měli obdržet ze ZS, který je charakterizován N, µ, 2, . Ze ZS pořídíme všechny teoretické možné Vsy, kterých je nekonečně mnoho. v každém VS spočítáme a všechny tyto průměry nám vytvoří teoretický soubor výběrových průměrů  střední hodnota výběrových průměrů µ = E().



D() = 2 / n při výběru s vracením

D() = (2 / n) * [(N - n) / (N - 1)] při výběru bez vracení

Předpoklady při konstrukci odhadů

    1. provádět konstrukci odhadů

    1. v případech, kde se jedná o výběry ze ZS s normálním rozdělením

    2. rozdělení ZS je libovolné  výběr je proveden z libovolně rozděleného ZS, předpokladem je dostatečný rozsah VS (n  30)




    1. konstrukce odhadů se opírá o veličinu:

  1. µ = (x - µ) / (2 / n) = normální normované rozdělení
    N(0,1)  µ  0,  = 1

  2. t = (x - µ) / [so2 / (n – 1)] = studentovo t-rozdělení (t(n-1))



Způsoby odhadu

Bodový odhad - spočívá v prohlášení hodnoty určité charakteristiky za náhradu neznámé charakteristiky ZS
Intervalový odhad - spočívá ve stanovení intervalu, ve kterém se neznámá charakteristika ZS vyskytuje s určitou, předem známou pravděpodobností

Bodový odhad

µ - průměr je nejlepším nezkresleným odhadem ZS. Na bodový odhad klademe určité požadavky:


      1. nestrannost odhadu
        E(t) = T (t – použitá charakteristika, T – charakteristika ZS)
        E(t)  T ......charakteristika dává pozitivně vychýlený odhad
        E(t)  T.......charakteristika dává negativně vychýlený odhad

      2. konzistentnost - s rostoucím rozsahem výběru se bude použitá charakteristika stále více blížit charakteristice ZS (T)

      3. vydatnost - nejvydatnější (přesnější) je ta charakteristika, která má nejmenší rozptyl

      4. postačující - pokud shrnuje všechny informace, které poskytuje daný VS


Bodový odhad průměru ZS
E() = µ D() = 2 / n
Nestranný, vydatný, postačující  proto mu dáváme přednost před jakýmikoliv charakteristikami polohy.
Bodový odhad rozptylu ZS

so2 – nesplňuje požadavek nestrannosti, je odhadem zkresleným ; proto ho nepoužíváme, ale použijeme s2

s2 = odhad rozptylu ZS

s2 = (xi )2 / (n – 1)  splňuje již požadavky na nestrannost a konzistenci
směrodatná odchylka s = s2

rozptyl použijeme i u variačního koeficientu V....v´ = s /





Yüklə 0,58 Mb.

Dostları ilə paylaş:
1   2   3   4   5   6   7   8   9   ...   18




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©www.genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə