Statistika



Yüklə 0,58 Mb.
səhifə18/18
tarix06.05.2018
ölçüsü0,58 Mb.
#43206
1   ...   10   11   12   13   14   15   16   17   18

Hlediska srovnávání


  1. věcná – průměrná dojivost zemědělských družstev

  2. prostorová – mzda v Severočeském a Jihočeském kraji – nejčastější

  3. časová – inflace v roce 2000 a 1999


Index – poměr 2 hodnot téhož ukazatele bez ohledu na to, jestli se jedná o srovnávání z věcného, prostorového či časového hlediska. Je to poměrné číslo, zlomek, bezrozměrná charakteristika vyjádřená většinou v %. Údaj, který je ve jmenovateli = základ indexu.

Srovnáváme


  1. ukazatele zjištěné přímo měřením, vážením

  2. pomocí indexu můžeme také porovnávat různé statistické charakteristiky (, s2, variační koeficienty)

Lze srovnávat pouze ukazatele, které jsou obsahově shodně vymezeny. Při srovnávání ukazatelů z různých statistických souborů je třeba zachovat požadavek srovnatelnosti statistických souborů.

Ukazatele


  1. extenzitní – charakterizují množství, objem, úhrn, rozsah určitého jevu, získáme je měřením, spočítáním. Sčítáme je pomocí součtu, př. počet pracovníků, sklizňové plochy.

  2. intenzitní – vyjadřují určitou úroveň, hladinu, intenzitu určitého jevu. Jsou to poměrné ukazatele a vznikají jako podíl dvou extenzivních ukazatelů. Shrnujeme je pomocí podílů součtů extenzitních ukazatelů. Tyto podíly lze vyjádřit ve formě váženého aritmetického průměru nebo váženého harmonického průměru, např. průměrná mzda, ha výnos.



Ukazatele dle shrnování


    1. stejnorodé

  1. extenzitní – pokud lze ukazatel shrnovat součtem v přirozených měrných jednotkách (tuny sklizně v okrese, hmotnost výrobků)

  2. intenzitní – jsou-li oba extenzitní ukazatelé stejnorodí, např. ha výnos = sklizeň pšenice/sklizňová plocha pšenice.

    1. nestejnorodé

  1. extenzitní – pokud nelze prostě sčítat (objem produkce různých plodin)

  2. intenzitní – nejsou-li extenzitní ukazatelé stejnorodí (sklizeň pšenice/sklizňová plocha řepky)



Indexy


    1. individuální (stejnorodé ukazatele)

      1. množství – extenzitní ukazatele

      2. úrovně – intenzitní ukazatele

        1. souhrnné (nestejnorodé ukazatele)

  1. množství

  2. úrovně

Individuální indexy množství


Základní období, ke kterému srovnáváme značíme indexem 0, běžné období, které srovnáváme, značíme indexem 1. Extenzitní ukazatele jsou q0 a q1, intenzitní ukazatele jsou p0 a p1.
Podíl: Rozdíl:

Složený individuální index množství:



Individuální indexy úrovně


Součet nelze provést pomocí prostého součtu, lze provést pomocí podílů součtů.


Index proměnlivého složení – vyjadřuje vliv změny obou ukazatelů



Index stálého složení – ustáleného váhy srovnávaných průměrů

  1. vztažený k základnímu období
    průměrový tvar (vážený ar. průměr):

  2. vztažený k běžnému období – používá se z praktických důvodů, protože vyjadřuje dynamiku vývoje
    průměrový tvar (vážený harm. průměr):


Index struktury – index, který měří vliv změny ve složení nositele intenzity na průměrnou změnu intenzitního ukazatele.

  1. vztažený k základnímu období


  2. vztažený k běžnému období

Naznačují předpoklad postupných změn:


Index proměnlivého složení lze rozložit na součin indexu stálého složení a indexu struktury:
a)

b)


Souhrnné indexy množství

Nestejnorodé extenzitní ukazatele. Prostý součin nemá smysl, jsou nesouměřitelné (např. objem různorodé produkce). Snažíme se dosáhnout podmíněné souměřitelnosti, čehož dosahujeme pomocí souměřitelů, což jsou intenzitní ukazatele:



  1. kalorie – u potravin

  2. ceny – používají se nejčastěji (stálé, nákupní, tržní)




  1. Souměřitel je cena základního období
    průměr. tvar:

  2. Souměřitel je cena běžného období
    průměrový tvar:

  3. Souměřitel je cena stálá – může to být průměrná cena základního a běžného období


Souhrnné indexy úrovně

Jsou to indexy nestejnorodých intenzitních ukazatelů, které vznikají jako podíl dvou extenzitních



  1. v čitateli je ukazatel sejnorodý (pq) a nositel intenzity q je nestejnorodý ukazatel ve jmenovateli – nejběžnější, např. ceny za jednotku různých výrobků, což jsou nestejnorodé, ale souměřitelné ukazatele, patří sem cenové indexy.



CENOVÉ INDEXY


    1. Laspeyresův index – množství ustavuje na základním období, nejběžněji používaný u nás:


    2. Paascheho index – produkce běžného období, bude se u nás používat po vstupu do EU


    3. Fisherův cenový index – je geometrickým průměrem obou předchozích, odstraňuje nedostatky obou. Je méně používaný, protože je obtížně interpretovatelný.


    4. Loweho index – používáme stálou produkci, což může být průměrná produkce běžného a základního období


    5. Edgeworthův-Marshallův index – ve tvaru aritmetického, geometrického nebo harmonického průměru (volba tvaru záleží na problematice a datech).

      • aritmetický průměr:

      • geometrický průměr:

      • harmonický průměr:

    6. Montgomeryho index – obtížně interpretovatelný





  1. pq je ukazatelem nestejnorodým a q je stejnorodé – např. produktivita práce. Jde o ukazatele nestejnorodé, ale i nesouměřitelné. Srovnáváme převrácené hodnoty a můžeme k této analýze použít všech souhrnných indexů úrovně (ad a))

  2. pq je ukazatelem nestejnorodým a q je též nestejnorodé – nelze srovnávat, jsou nesouměřitelné. Např. ukazatel spotřeby různých materiálů na jednotku různorodé produkce.



Rozklad indexů


    1. Rozklad stejnorodého extenzitního ukazatele na složky vyjadřující vliv dvou činitelů

    1. p a q jsou stejnorodé ukazatele:

    2. p a q jsou nestejnorodé ukazatele – na základě předpokladu postupných změn

      • vliv změny q:

      • vliv změny p:

hodnotový index – když se p změní na c, rozkládá se na cenový index a index fyzického objemu:

        1. (rozklad na Laspeyresův index a index objemu)

        2. (rozklad na index objemu a Paascheho index)




    1. Rozklad indexů stejnorodého extenzitního ukazatele na složky vyjadřující vliv tří ukazatelů

          1. p, q, c jsou stejnorodé ukazatele:



          1. p, q, c jsou nestejnorodé ukazatele – používá se častěji, z hlediska analýzy je vhodnější, někdy se používá u stejnorodých ukazatelů:

            Nedostatkem je víceznačnost rozkladu indexu, což vede k jednoznačnému rozkladu:



            z = zbytkový člen, který vyjadřuje vliv ostatních ukazatelů, které nejsou v modelu zařazeny.

Metody vícerozměrné statistické analýzy


Jednotky = prvky statistického souboru (základní, výběrové)

Statistické znaky = vlastnosti jednotky (kvalitativní, kvantitativní)
Metody analýzy rozptylu – 1 kvantitativní a 1 kvalitativní znak.

Regresní a korelační analýza – 2 kvantitativní znaky.

Analýza kvalitativních znaků – 2 kvalitativní znaky.

Základní členění metod


  1. metody klasifikace jednotek – shluková analýza, diskriminační analýza

  2. metody analýzy vztahů mezi proměnnými – kanonická korelační analýza, faktorová analýza, analýza hlavních komponent, regrese na hlavních komponentách


Shluková analýza (Cluster Analysis)

Souhrnný název pro řadu výpočetních postupů, jejichž cílem je rozklad daného souboru na několik relativně homogenních skupin (shluků) a to tak, aby jednotky uvnitř jednotlivých shluků si byly co nejvíce podobny a jednotky patřící do jiných shluků co nejvíce nepodobny. Každá jednotka je popsána celou řadou statistických znaků. Podobnost či nepodobnost sledovaných jednotek je třeba číselně vyjádřit, k čemuž se nejčastěji používá míra vzdálenosti. Míra vzdálenosti má 2 formy (eukleidovská, hammingova). Po určení míry vzdálenosti začneme jednotky shlukovat. Nejprve se sdruží do jednoho shluku takové dvě jednotky, jejichž vzdálenost je nejmenší. Shluk může obsahovat i jen 1 jednotku.


Metody shlukování dle míry vzdálenosti: nejbližšího souseda, nejvzdálenějšího souseda, průměrné vzdálenosti, centroidní, mediánová, Wardova
Výpočet metod končí po (n – 1) krocích tím, že všechny jednotky splynou v jeden shluk.
Postup: ze skupiny se tvoří nejprve 2 shluky, pak to pokračuje. Počet shluků závisí na míře vzdálenosti a metodě shlukování.
Využití:

  1. k rozdělení množiny jednotek do tříd na základě jejich příslušnosti z hlediska uvažovaných proměnných

  2. k redukci počtu jednotek při minimální ztrátě informace


Diskriminační analýza

Řeší problematiku vícerozměrné klasifikace. Předmětem je nalezení statisticky nejvhodnějšího způsobu rozlišení mezi dvěma či více skupinami statistických jednotek. Klasická úloha diskriminační analýzy spočívá v tom, že jsou předem známy dvě či více skupin jednotek a o každé jednotce víme, do které skupiny patří. Na základě naměřených údajů se spočítá diskriminační funkce, která slouží k dodatečnému zařazování nové jednotky. Podle funkce lze vypočítat pravděpodobnost s jakou daná jednotka patří do některé z uvažovaných skupin.



Použití: zařazení archeologický (geologických) nálezů do skupin podle stáří, zařazování osob dle zdravotního stavu, temperamentu.

Kanonická korelační analýza


Vychází z logického členění proměnných do 2 skupin (např. závislé x nezávislé; výchozí x cílové; příčiny x důsledky). Každá skupina je charakterizována jednou souhrnnou veličinou, tzv. kanonickou proměnnou, která je lineární kombinací původních veličin dané skupiny.


  1. skupina – má s původních veličin => kanonická proměnná:

  2. skupina – má p – s původních veličin => kanonická proměnná:

    • hledáme také lineární kombinace, kde je korelace mezi kanonickými proměnnými maximální:

Kanonická korelační analýza představuje nejvyšší stupeň zhuštěné informace o závislosti dvou logicky sestavených skupin veličin. Použití: vyhodnocení dotazníků, hodnocení vstupů a výstupů reprodukčního procesu v zemědělství.



Faktorová analýza


Umožňuje objasnit strukturu pozorovaných závislostí, redukuje počet výchozích proměnných pomocí hypotetických faktorů při minimalizaci zátěže informace a odhaduje skryté vztahy mezi proměnnými.
Model faktorové analýzy: soustava lineárních rovnic, ve které jsou skutečné proměnné x1…xm vyjádřeny pomocí fiktivních proměnných a to tzv. společných faktorů F1 …Fc a jedinečných faktorů U1 … Um. Platí c  m.

ajp = faktor zátěže společných faktorů

dj = faktor zátěže jedinečných faktorů
Do modelu faktorové analýzy se zařazují společné faktory se závažnými hodnotami zátěží nejméně u dvou skutečných proměnných. Pokud , jde o závažnou hodnotu zátěže.
Při výpočtu mají spolčené faktory (F) směrem od prvního nadřazené postavení:

  1. společný faktor F1 – výpočet se snaží vysvětlit co největší část informace (rozptylu) obsažené v soustavě proměnných.

  2. společný faktor F2 – vysvětluje tu část rozptylu všech proměnných, kterou se nepodařilo vysvětlit F1

Při faktorové analýze interpretujeme společné faktory a faktor zátěže společných faktorů.


Použití: navrhování dotazníků, zpracování dotazníků se znaky kvalitativními i kvantitativními
Analýza hlavních komponent

Spočívá v transformaci souboru napozorovaných proměnných do hypotetických proměnných, tzv. hlavních komponent. Hlavní komponenty jsou seřazeny bezezbytkově podle svého příspěvku k vysvětlení celkového rozptylu napozorovaných proměnných. Analýza je citlivá na jednotky => normování (převod na společný základ).


Základní model:

zj = napozorovaná proměnná v normovaném tvaru

akj = váhy lineární kombinace hlavních komponent

Fk = hlavní komponenty v normovaném tvaru

Metoda analýzy hlavních komponent vysvětluje bezezbytkově celkový rozptyl. Použití je podobné jako u faktorové analýzy.



Regrese na hlavních komponentách

Vícenásobný regresivní model předpokládá nezávislost nezávislých proměnných, což v praxi nebývá splněno, a proto se doporučuje do vícerozměrného regresního modelu zařadit místo napozorovaných proměnných hlavní komponenty.
Yüklə 0,58 Mb.

Dostları ilə paylaş:
1   ...   10   11   12   13   14   15   16   17   18




Verilənlər bazası müəlliflik hüququ ilə müdafiə olunur ©www.genderi.org 2024
rəhbərliyinə müraciət

    Ana səhifə