Když jsme na konci ledna publikovali interaktivní nástroj pro analýzu souvislostí volebních výsledků, někteří čtenáři postrádali možnost porovnat statistické ukazatele navzájem.
Připravili jsme proto aktualizovanou verzi nástroje (původní je stále k dispozici). Nově můžete srovnávat každou veličinu s každou jinou veličinou. Už se tedy nemusíte omezovat jen na politiku, ale můžete hledat i regionální souvislosti (na úrovni okresů + hlavního města) napříč statistickými ukazateli.
Pozor ale na ukvapené závěry. V regionech, kde je vyšší nezaměstnanost, je zároveň obecně nižší délka předpokládaného dožití. Vyvozovat z toho ale, že práce přidává roky života, je příliš zjednodušené. Údaje jsou na regionální úrovni, proto nelze vyvozovat přímé osobní souvislosti. Pravděodobné je, že nezaměstnanost i nižší předpokládaná délka dožití jsou výsledkem dalších vlivů v regionu.
Interaktivní mapy a grafy - najděte souvislosti (vylepšené)
(Zdroj dat: Český statistický úřad, MapaExekuci.cz, Volby.iDNES.cz)
- Interaktivní vizualizaci si také můžete otevřít v novém okně
Jak vyhledávat souvislosti na mapěStručný návod k využití naší interaktivní přílohy
|
Jak nástroj ovládat? Podívejte se na náš videonávod:
Korelace neznamená příčinnou souvislost
Samozřejmě i tentokrát platí naše připomínka, že korelace neimplikuje kauzalitu. Nelze tedy říci, že jen proto, že spolu některé veličiny souvisí, můžeme okamžitě předpokládat vztah příčiny a následku. Korelace totiž pouze ukazuje na určitou číselnou podobnost. Nelze ale pouze na základě pozitivní korelace tvrdit, že nějaká vlastnost je důsledkem vlastnosti jiné.
Korelační koeficientStručné vysvětlení toho, co to znamená, když spolu řady korelují Abychom si názorně ukázali, jak lze posuzovat souvislost mezi dvěma řadami čísel nebo dvěma různými parametry stejné „populace“, podíváme se na jednoduchý fiktivní příklad. Máme tabulku se šesti fiktivními osobami. Pokud informace o těchto osobách naneseme na dvourozměrný graf, vidíme, že některé informace spolu souvisí, zatímco jiné nikoli. Míru korelace měříme Pearsonovým korelačním koeficientem. Ukázkové korelace mezi hodnotami: váha a výška spolu v našem příkladu souvisí velmi silně (ρ=0,81), tedy obecně platí „čím vyšší člověk, tím vyšší váha“. Příjem a výška spolu nesouvisí vůbec (ρ=0,03) a mezi příjmem a věkem je středně velká opačná souvislost (ρ=-0,59), tedy „čím starší člověk, tím nižší příjem“. Všimněte si, že ani vysoká korelace neznamená stoprocentní závislost jedné veličiny na druhé. (Rozklikněte pro zobrazení) Nelze jednoznačně říci, jaká korelace už je „silná“ a jaká je naopak slabá, záleží na kontextu, na typu měření a na dalších faktorech. Také proto se nechceme zaměřit na jediné číslo. Zvláště když - jak už jsme zdůraznili - korelace sama o sobě neznamená, že jedna z hodnot má přímý vliv na druhou hodnotu. Třeba v příkladech výše: zatímco souvislost váhy s výškou je celkem logická, souvislost příjmu s věkem může být zcela náhodná nebo způsobená dalšími faktory. |
V našem případě navíc mluvíme o datech na úrovni regionu. Pokud je tedy například relativně vysoká korelace mezi veličinami „podíl ateistů“ a „podíl obyvatel v exekuci“, neznamená to nutně, že by to byli právě ateisté, kteří jsou v exekuci. Korelace dat v regionech totiž nemusí ukazovat na korelaci na úrovni jednotlivců.
Zde je přehled korelačních koeficientů všech námi zpracovaných veličin:
Několik vybraných korelací:
- podíl cizinců a přírustek obyvatel - v regionech, kde je větší přírůstek obyvatel, je obecně také větší podíl cizinců. Nejjednodušší vysvětlení (které by samozřejmě bylo potřeba podložit dalšími daty) je varianta, že právě cizinci spoluvytvářejí tento přírůstek. Interaktivní mapa ale ukazuje, že tuto korelaci způsobuje především hlavní město Praha, když jej z dat vyřadíme, tato korelace výrazně klesá. Proto je důležité dívat se na konkrétní data, nikoli jen souhrnná čísla.
- víra a rozvodovost - v regionech, kde je větší podíl lidí hlásících se k náboženskému vyznání, je menší počet rozvodů na 100 tisíc obyvatel. Zde lze předpokládat příčinnou souvislost, náboženské církve jsou známé svým důrazem na instituci manželství.
- nezaměstnanost a exekuce - regiony s vysokou nezaměstnaností mají obecně vyšší podíl obyvatel v exekučním řízení. Opět jde o souvislost, která je celkem pochopitelná: lidé bez práce mají problémy splácet měsíční splátky a snáze tak spadnou do exekuce.
Data, která jsme použili, jsou čtenářům k dispozici. Pokud najdete chybu v datech či grafech, dejte nám vědět v komentářích, rádi chybu opravíme. Stejně tak se těšíme na to, jakých souvislostí si za použití našeho „korelovátka“ všimnete. A pro jistotu znovu zopakujeme naše minulé upozornění: pamatujte, že statistika někdy může svádět ke zjednodušování na základě jednoznačných čísel. Což by byla škoda, zvláště, když je vykreslený obraz České republiky tak pestrý.
Aktualizace: Do článku jsme doplnili konkrétní příklady. Doplnili jsme videonávod.