Jiří Zajíc

Osobní web

Statistika

Počet zobrazení článků
135422

Připojeni

Právě přítomno: 21 hostů a žádný člen

Citát

Talmud fol. 7a.3

Buďte obezřelí při jednání s vládci, neboť ti nestrpí nablízku nikoho, koho by nechtěli sami využít. Tváří se přátelsky ve chvíli, kdy tě potřebují, ale nikoho se nezastanou v době nouze.

Talmud fol. 7a 3

 

Výpočet prezidenta

úředním šimlem

Když v médiích proskočily zprávy o chybné metodice výpočtu neplatných hlasů v peticích pro volbu prezidenta, chvíli jsem se neorientoval. Když jsem se seznámil s potřebnými informacemi, užasl jsem nad mírou nekompetentnosti posuzovatelů.

Výlet do statistiky

Ve statistice rozeznáváme dvě hlavní odvětví – statistiku popisnou a statistiku výběrovou. Statistika popisná pracuje se všemi prvky souboru, výběrová na základě vlastností výběru usuzuje na vlastnosti celku. Tedy máme-li například 10000 objektů, v rámci popisné statistiky je zkontrolujeme všechny. Ve výběrové statistice si z oněch 10000 objektů vybereme například 2 vzorky po 1000 objektech. Zkontrolujeme je a usoudíme na pravděpodobné vlastnosti celku. Jedná se o pravděpodobnost, protože 8000 oněch objektů jsme vůbec nekontrolovali.

Jednoduchý příklad

Popisná statistika

Zkontrolujeme 10000 kuliček červené a modré barvy. Najdeme například 4000 červených a 6000 modrých, tedy 40% červených a 60% modrých.

Výběrová statistika

Ze stejného souboru naslepo vybereme dva vzorky po 1000 kuličkách. V jednom najdeme 380 červených a 620 modrých, tedy 38% červených a 62% modrých. Ve druhém najdeme 400 červených a 600 modrých, tedy 40% červených a 60% modrých. Ve výběru 2000 kuliček, skládajícím se z těchto dvou vzorků, je tedy 780 červených a 1220 modrých, tedy 39% a 61%. 1% rozdílu je v podstatě takzvaná statistická chyba, znamenající, že ani poctivě udělaný výběr nereprezentuje celek úplně přesně. Statistika má postupy, umožňující stanovit pravděpodobnou hodnotu této statistické chyby.

Šiml řehtá a hrabe kopytem

Sešla se komise MV, dostala tento soubor kuliček a vybrala výše uvedené dva vzorky. Veřejnosti moudře sdělila, že našla v souboru 10000 kuliček vzorky s 60% a 61% modrých, tedy 120% modrých. Soubor 10000 kuliček tedy obsahuje 12000 modrých.

Kulaté razítko.

V čem je chyba?

Dělení není komutativní operace. To znamená, že sčítáme-li před dělením a po dělení, dostaneme různé výsledky. Myslím, že se to učí v 6. třídě ZŠ. Závěr si laskavý čtenář udělá sám.

A znovu statistika

Pokud se dělají korektní statistické výpočty, patří k výpočtu odhad statistické chyby. Trochu vzdálené a nepřesné připodobnění: nejistota měření policejním radarem je +-3km/h. Proto vám hlídka od naměřeného údaje odečítá 3km/h, aby se vyloučily pochybnosti o nepřesnosti měření. Nejde náhodou při volbě prezidenta o víc? Při "výpočtu prezidenta" vůbec nejsou brána v úvahu dvě základní rizika - že bude na základě výběrové statistiky vyřazen kandidát, který ve skutečnosti má podpisů dost, nebo propuštěn do volby kandidát, který ve skutečnosti má podpisů málo.

Copyright © 2019. All Rights Reserved.