Statistika

Yüklə 0,58 Mb.

səhifə	18/18
tarix	06.05.2018
ölçüsü	0,58 Mb.
	#43206

1 ... 10 11 12 13 14 15 16 17 18

Hlediska srovnávání

věcná – průměrná dojivost zemědělských družstev
prostorová – mzda v Severočeském a Jihočeském kraji – nejčastější
časová – inflace v roce 2000 a 1999

Index – poměr 2 hodnot téhož ukazatele bez ohledu na to, jestli se jedná o srovnávání z věcného, prostorového či časového hlediska. Je to poměrné číslo, zlomek, bezrozměrná charakteristika vyjádřená většinou v %. Údaj, který je ve jmenovateli = základ indexu.

Srovnáváme

ukazatele zjištěné přímo měřením, vážením
pomocí indexu můžeme také porovnávat různé statistické charakteristiky (, s², variační koeficienty)

Lze srovnávat pouze ukazatele, které jsou obsahově shodně vymezeny. Při srovnávání ukazatelů z různých statistických souborů je třeba zachovat požadavek srovnatelnosti statistických souborů.

Ukazatele

extenzitní – charakterizují množství, objem, úhrn, rozsah určitého jevu, získáme je měřením, spočítáním. Sčítáme je pomocí součtu, př. počet pracovníků, sklizňové plochy.
intenzitní – vyjadřují určitou úroveň, hladinu, intenzitu určitého jevu. Jsou to poměrné ukazatele a vznikají jako podíl dvou extenzivních ukazatelů. Shrnujeme je pomocí podílů součtů extenzitních ukazatelů. Tyto podíly lze vyjádřit ve formě váženého aritmetického průměru nebo váženého harmonického průměru, např. průměrná mzda, ha výnos.

Ukazatele dle shrnování

stejnorodé

extenzitní – pokud lze ukazatel shrnovat součtem v přirozených měrných jednotkách (tuny sklizně v okrese, hmotnost výrobků)
intenzitní – jsou-li oba extenzitní ukazatelé stejnorodí, např. ha výnos = sklizeň pšenice/sklizňová plocha pšenice.

nestejnorodé

extenzitní – pokud nelze prostě sčítat (objem produkce různých plodin)
intenzitní – nejsou-li extenzitní ukazatelé stejnorodí (sklizeň pšenice/sklizňová plocha řepky)

Indexy

individuální (stejnorodé ukazatele)

množství – extenzitní ukazatele
úrovně – intenzitní ukazatele
1. souhrnné (nestejnorodé ukazatele)

množství
úrovně

Individuální indexy množství

Základní období, ke kterému srovnáváme značíme indexem 0, běžné období, které srovnáváme, značíme indexem 1. Extenzitní ukazatele jsou q₀ a q₁, intenzitní ukazatele jsou p₀ a p₁.
Podíl:

Rozdíl:

Složený individuální index množství:

Individuální indexy úrovně

Součet nelze provést pomocí prostého součtu, lze provést pomocí podílů součtů.

Index proměnlivého složení – vyjadřuje vliv změny obou ukazatelů

Index stálého složení – ustáleného váhy srovnávaných průměrů

vztažený k základnímu období
průměrový tvar (vážený ar. průměr):
vztažený k běžnému období – používá se z praktických důvodů, protože vyjadřuje dynamiku vývoje
průměrový tvar (vážený harm. průměr):

Index struktury – index, který měří vliv změny ve složení nositele intenzity na průměrnou změnu intenzitního ukazatele.

vztažený k základnímu období
vztažený k běžnému období

Naznačují předpoklad postupných změn:

Index proměnlivého složení lze rozložit na součin indexu stálého složení a indexu struktury:
a)

Souhrnné indexy množství

Nestejnorodé extenzitní ukazatele. Prostý součin nemá smysl, jsou nesouměřitelné (např. objem různorodé produkce). Snažíme se dosáhnout podmíněné souměřitelnosti, čehož dosahujeme pomocí souměřitelů, což jsou intenzitní ukazatele:

kalorie – u potravin
ceny – používají se nejčastěji (stálé, nákupní, tržní)

Souměřitel je cena základního období
průměr. tvar:
Souměřitel je cena běžného období
průměrový tvar:
Souměřitel je cena stálá – může to být průměrná cena základního a běžného období

Souhrnné indexy úrovně

Jsou to indexy nestejnorodých intenzitních ukazatelů, které vznikají jako podíl dvou extenzitních

v čitateli je ukazatel sejnorodý (pq) a nositel intenzity q je nestejnorodý ukazatel ve jmenovateli – nejběžnější, např. ceny za jednotku různých výrobků, což jsou nestejnorodé, ale souměřitelné ukazatele, patří sem cenové indexy.

CENOVÉ INDEXY

Laspeyresův index – množství ustavuje na základním období, nejběžněji používaný u nás:
Paascheho index – produkce běžného období, bude se u nás používat po vstupu do EU
Fisherův cenový index – je geometrickým průměrem obou předchozích, odstraňuje nedostatky obou. Je méně používaný, protože je obtížně interpretovatelný.
Loweho index – používáme stálou produkci, což může být průměrná produkce běžného a základního období
Edgeworthův-Marshallův index – ve tvaru aritmetického, geometrického nebo harmonického průměru (volba tvaru záleží na problematice a datech).
- aritmetický průměr:
- geometrický průměr:
- harmonický průměr:
Montgomeryho index – obtížně interpretovatelný

pq je ukazatelem nestejnorodým a q je stejnorodé – např. produktivita práce. Jde o ukazatele nestejnorodé, ale i nesouměřitelné. Srovnáváme převrácené hodnoty a můžeme k této analýze použít všech souhrnných indexů úrovně (ad a))
pq je ukazatelem nestejnorodým a q je též nestejnorodé – nelze srovnávat, jsou nesouměřitelné. Např. ukazatel spotřeby různých materiálů na jednotku různorodé produkce.

Rozklad indexů

Rozklad stejnorodého extenzitního ukazatele na složky vyjadřující vliv dvou činitelů

p a q jsou stejnorodé ukazatele:
p a q jsou nestejnorodé ukazatele – na základě předpokladu postupných změn
- vliv změny q:
- vliv změny p:

hodnotový index – když se p změní na c, rozkládá se na cenový index a index fyzického objemu:

(rozklad na Laspeyresův index a index objemu)
(rozklad na index objemu a Paascheho index)

Rozklad indexů stejnorodého extenzitního ukazatele na složky vyjadřující vliv tří ukazatelů

p, q, c jsou stejnorodé ukazatele:

p, q, c jsou nestejnorodé ukazatele – používá se častěji, z hlediska analýzy je vhodnější, někdy se používá u stejnorodých ukazatelů:

Nedostatkem je víceznačnost rozkladu indexu, což vede k jednoznačnému rozkladu:

z = zbytkový člen, který vyjadřuje vliv ostatních ukazatelů, které nejsou v modelu zařazeny.

Metody vícerozměrné statistické analýzy

Jednotky = prvky statistického souboru (základní, výběrové)

Statistické znaky = vlastnosti jednotky (kvalitativní, kvantitativní)
Metody analýzy rozptylu – 1 kvantitativní a 1 kvalitativní znak.

Regresní a korelační analýza – 2 kvantitativní znaky.

Analýza kvalitativních znaků – 2 kvalitativní znaky.

Základní členění metod

metody klasifikace jednotek – shluková analýza, diskriminační analýza
metody analýzy vztahů mezi proměnnými – kanonická korelační analýza, faktorová analýza, analýza hlavních komponent, regrese na hlavních komponentách

Shluková analýza (Cluster Analysis)

Souhrnný název pro řadu výpočetních postupů, jejichž cílem je rozklad daného souboru na několik relativně homogenních skupin (shluků) a to tak, aby jednotky uvnitř jednotlivých shluků si byly co nejvíce podobny a jednotky patřící do jiných shluků co nejvíce nepodobny. Každá jednotka je popsána celou řadou statistických znaků. Podobnost či nepodobnost sledovaných jednotek je třeba číselně vyjádřit, k čemuž se nejčastěji používá míra vzdálenosti. Míra vzdálenosti má 2 formy (eukleidovská, hammingova). Po určení míry vzdálenosti začneme jednotky shlukovat. Nejprve se sdruží do jednoho shluku takové dvě jednotky, jejichž vzdálenost je nejmenší. Shluk může obsahovat i jen 1 jednotku.

Metody shlukování dle míry vzdálenosti: nejbližšího souseda, nejvzdálenějšího souseda, průměrné vzdálenosti, centroidní, mediánová, Wardova
Výpočet metod končí po (n – 1) krocích tím, že všechny jednotky splynou v jeden shluk.
Postup: ze skupiny se tvoří nejprve 2 shluky, pak to pokračuje. Počet shluků závisí na míře vzdálenosti a metodě shlukování.
Využití:

k rozdělení množiny jednotek do tříd na základě jejich příslušnosti z hlediska uvažovaných proměnných
k redukci počtu jednotek při minimální ztrátě informace

Diskriminační analýza

Řeší problematiku vícerozměrné klasifikace. Předmětem je nalezení statisticky nejvhodnějšího způsobu rozlišení mezi dvěma či více skupinami statistických jednotek. Klasická úloha diskriminační analýzy spočívá v tom, že jsou předem známy dvě či více skupin jednotek a o každé jednotce víme, do které skupiny patří. Na základě naměřených údajů se spočítá diskriminační funkce, která slouží k dodatečnému zařazování nové jednotky. Podle funkce lze vypočítat pravděpodobnost s jakou daná jednotka patří do některé z uvažovaných skupin.

Použití: zařazení archeologický (geologických) nálezů do skupin podle stáří, zařazování osob dle zdravotního stavu, temperamentu.

Kanonická korelační analýza

Vychází z logického členění proměnných do 2 skupin (např. závislé x nezávislé; výchozí x cílové; příčiny x důsledky). Každá skupina je charakterizována jednou souhrnnou veličinou, tzv. kanonickou proměnnou, která je lineární kombinací původních veličin dané skupiny.

skupina – má s původních veličin => kanonická proměnná:
skupina – má p – s původních veličin => kanonická proměnná:
- hledáme také lineární kombinace, kde je korelace mezi kanonickými proměnnými maximální:

Kanonická korelační analýza představuje nejvyšší stupeň zhuštěné informace o závislosti dvou logicky sestavených skupin veličin. Použití: vyhodnocení dotazníků, hodnocení vstupů a výstupů reprodukčního procesu v zemědělství.

Faktorová analýza

Umožňuje objasnit strukturu pozorovaných závislostí, redukuje počet výchozích proměnných pomocí hypotetických faktorů při minimalizaci zátěže informace a odhaduje skryté vztahy mezi proměnnými.
Model faktorové analýzy: soustava lineárních rovnic, ve které jsou skutečné proměnné x₁…x_m vyjádřeny pomocí fiktivních proměnných a to tzv. společných faktorů F₁ …F_c a jedinečných faktorů U₁ … U_m. Platí c  m.

a_jp = faktor zátěže společných faktorů

d_j = faktor zátěže jedinečných faktorů
Do modelu faktorové analýzy se zařazují společné faktory se závažnými hodnotami zátěží nejméně u dvou skutečných proměnných. Pokud

, jde o závažnou hodnotu zátěže.
Při výpočtu mají spolčené faktory (F) směrem od prvního nadřazené postavení:

společný faktor F₁ – výpočet se snaží vysvětlit co největší část informace (rozptylu) obsažené v soustavě proměnných.
společný faktor F₂ – vysvětluje tu část rozptylu všech proměnných, kterou se nepodařilo vysvětlit F₁

Při faktorové analýze interpretujeme společné faktory a faktor zátěže společných faktorů.

Použití: navrhování dotazníků, zpracování dotazníků se znaky kvalitativními i kvantitativními
Analýza hlavních komponent

Spočívá v transformaci souboru napozorovaných proměnných do hypotetických proměnných, tzv. hlavních komponent. Hlavní komponenty jsou seřazeny bezezbytkově podle svého příspěvku k vysvětlení celkového rozptylu napozorovaných proměnných. Analýza je citlivá na jednotky => normování (převod na společný základ).

Základní model:

z_j = napozorovaná proměnná v normovaném tvaru

a_kj = váhy lineární kombinace hlavních komponent

F_k = hlavní komponenty v normovaném tvaru

Metoda analýzy hlavních komponent vysvětluje bezezbytkově celkový rozptyl. Použití je podobné jako u faktorové analýzy.

Regrese na hlavních komponentách

Vícenásobný regresivní model předpokládá nezávislost nezávislých proměnných, což v praxi nebývá splněno, a proto se doporučuje do vícerozměrného regresního modelu zařadit místo napozorovaných proměnných hlavní komponenty.

Yüklə 0,58 Mb.

Dostları ilə paylaş:

1 ... 10 11 12 13 14 15 16 17 18