Náhoda, štěstí a nevědomost: jak vyjádřit naši nejistotu v číslech

Souhrn
David Spiegelhalter, statistik a popularizátor vědy, ve své přednášce zkoumá koncept pravděpodobnosti a nejistoty. Argumentuje, že pravděpodobnost není objektivní vlastnost vnějšího světa, ale spíše subjektivní vyjádření naší nevědomosti a míry přesvědčení. Tuto myšlenku ilustruje na příkladu mince s dvěma hlavami, kde i počáteční odhad 50/50 je založen na (nesprávném) předpokladu. Zdůrazňuje rozdíl mezi aleatorní (náhodnou) a epistemickou (znalostní) nejistotou. Spiegelhalter uvádí příklad fiaska v Zátoce sviní, kde špatná komunikace nejistoty, nahrazení čísel vágními slovy, vedla ke katastrofálnímu rozhodnutí.
Přednáška se dále zabývá tím, jak můžeme kvantifikovat naši osobní nejistotu pomocí čísel a jak se vyhnout přehnané sebedůvěře. Spiegelhalter představuje Brierovo bodovací pravidlo, které se používá k hodnocení přesnosti pravděpodobnostních odhadů a motivuje k upřímnosti. Zmiňuje se také o standardizaci slov označujících pravděpodobnost v oblastech, jako je klimatická změna a zpravodajské služby (např. MI5). Nakonec se krátce dotýká tématu štěstí a rozlišuje různé typy štěstí, přičemž zdůrazňuje konstitutivní štěstí – to, kým a kde jsme se narodili, jako zásadní faktor, který nemůžeme ovlivnit.
Přepis
Umění nejistoty: O pravděpodobnosti a náhodě
Rád přednáším tady v Oxfordu, protože je tu vždycky skvělé publikum a dnes večer si i trochu zapracujete. Takže vám všem moc děkuji, že jste přišli v té zimě, a možná jste se sem přišli jen ohřát. To nevím, nevyčítal bych vám to.
O čem budu mluvit
Název souvisí s mojí novou knihou, která se jmenuje “The Art of Uncertainty” (Umění nejistoty) a zabývá se všemi těmito věcmi. Důvod, proč mě to zajímá, je, že když jsem byl v Oxfordu - dostal jsem se do Oxfordu, když mi bylo 18, bože, před více než půl stoletím - šel jsem na Keble College a mým tutorem byl Adrian Smith. Přišel jsem studovat matematiku, čistou matematiku.
V polovině druhého ročníku to začalo být příliš obtížné. Narazil jsem hlavou na svůj strop abstrakce. A přešel jsem k pravděpodobnosti a statistice, u kterých jsem zůstal dodnes. Byl jsem za to opravdu vděčný, že jsem to mohl udělat.
Důležitou součástí toho bylo, že jsem byl v raném věku indoktrinován, protože mým tutorem byl Adrian Smith, který je nyní prezidentem Královské společnosti, a překládal knihu italského pojistného matematika jménem De Finetti o pravděpodobnosti. Pointa De Finettiho myšlenky o pravděpodobnosti - kniha začíná tvrzením: pravděpodobnost neexistuje. Prostě jsme si ji vymysleli. A já jsem o tom přemýšlel 50 let a došel jsem k závěru, že má pravdu.
Pravděpodobnost jako vynález
Takže kniha je opravdu o tom, že pravděpodobnost je vynález. Je to výmysl, který jsme my lidé vytvořili - není divu, že jsme v tom tak špatní, protože jsme si to prostě vymysleli. Není to tam venku, možná na subatomární úrovni, ale i tam jsem trochu skeptický.
Celá pointa knihy je, že silně naznačuje, na základě toho, že pravděpodobnost je vyjádřením osobní nejistoty. Je to osobní vyjádření naší nevědomosti, naší míry přesvědčení. A tato nevědomost se může týkat budoucnosti, přítomnosti nebo minulosti, ale je to vztah mezi námi a vnějším světem, nikoli vlastnost vnějšího světa. Všechny naše pravděpodobnosti se budou lišit.
Dva typy nejistoty: demonstrace s mincí
Dovolte mi předvést něco, co stejně budu dělat během přednášky. Tak tady je mince. A rád bych se zeptal - jaká je pravděpodobnost, že padne hlava, než ji hodím? Většina odpoví 50 na 50, a jste si tím docela jistí, že?
Nyní jsem s mincí zatočil a zakryl ji. Jaká je pravděpodobnost, že je to hlava? Ano, trochu neochotně, trochu pomalu, ale došli jste ke stejné odpovědi.
Teď jsem úplně změnil význam té pravděpodobnosti:
- První část pravděpodobnosti byla o tom, čemu se říká aleatorní nejistota, náhoda. Předtím, než hodím mincí, nemohu vědět, jaký bude výsledek.
- Nyní je to to, čemu se říká epistemická nejistota. Je to moje osobní nevědomost. A moje nevědomost se liší od vaší nevědomosti.
A o tom si promluvíme. Budeme hodně mluvit o epistemických nejistotách, kdy vkládáte svou vlastní osobní nevědomost do čísel.
(Když se podíváte na moji minci, zjistíte, že je to mince se dvěma hlavami. Je vždy dobré ji mít u sebe.)
Pointa je, že za prvé byste mi neměli věřit. A za druhé, že i váš počáteční odhad 50/50 byl založen na úsudku, na předpokladu. Byla to vaše osobní odpověď, byl to úsudek, byl chybný, ale nevadí, udělali jste, co jste mohli.
Můj argument v průběhu celé této přednášky, a vlastně i v průběhu celé knihy, je, že každá pravděpodobnost, kterou používáme v našem každodenním životě, ve strojírenství, v klimatických změnách a ve všem, je konstrukce. Není to skutečné, není to pravdivé číslo, je to konstrukce založená na úsudku a přesvědčení.
O mé kariéře
Dělal jsem statistickou metodologii, chytré věci. No, docela chytré. Ne tak chytré, vlastně. Bayesovské věci. Pracoval jsem na nejistotě v umělé inteligenci v roce 1984 - věřili byste tomu? Před téměř 40 lety jsme si mysleli, že to máme vyřešené.
A podívejte se, teď něco zadáte do ChatGPT a vyjde z toho absolutně sebevědomé tvrzení a jen malým písmem dole je napsáno: “Oh, může to být špatně. Někdy lžu.” Opravdu, tohle není důvěryhodná komunikace nejistoty.
Dělal jsem všechny tyhle věci a pak jsem byl naštěstí v roce 2007 filantropicky financován Davidem Hardingem z Winton Capital Management, abych se věnoval komunikaci. Takže jsem se přeorientoval. Záměrně jsem chtěl být “Brianem Coxem statistiky”, takže jsem se záměrně přesunul k tvorbě televizních programů.
Bylo skvělé mít druhou kariéru - víte, opustit akademickou sféru a všechno to příšerné publikování článků a všechny ty nesmysly a stát se prostě performerem. Takže jsem měl opravdu štěstí a jsem za to velmi vděčný.
Napsal jsem několik knih - “Art of Statistics” se velmi dobře prodávala. A tohle je ta nová kniha. Prodává se venku se slevou. Jsou v ní všechny tyhle věci, o kterých nemůžu mluvit. V podstatě je to o tom, jak blábolím o všem, co mě napadne a co mě zajímalo 50 let, od té doby, co jsem byl jako mladý student indoktrinován o tom, co je to pravděpodobnost.
Co to vlastně je? Nikdo neví, co to je. Nikdo se na tom neshodne. Můžete si vyhledat definici a někdo si jí může být jistý a mýlí se, nebo určitě najdete jinou sebevědomou definici stejně rychle. Takže je to celá oblast, je to trochu chaos a já bych to chtěl dnes odpoledne trochu vyjasnit.
Co je to nejistota?
Toto je definice, která se mi líbí: vědomé uvědomění si nevědomosti. A řekl jsem, že nevědomost se může týkat budoucnosti, minulosti, toho, proč se věci staly, co se děje v současnosti. A to je definice, kterou používám v celé knize.
Vědomé uvědomění, které ji staví jako vztah mezi vámi a vnějším světem. A už jsme si ukázali tu věc s mincemi.
Zásadní věc, o které mluvím, je dekonstrukce nejistoty. A my se dnes večer budeme trochu věnovat dekonstrukci, a docela se mi líbí tahle fráze, jak pomalu přemýšlet o tom, že nevíte - a neříkat jen “oh, já nevím”. Ne, to nestačí. Musíme být trochu analytičtější.
Historický příklad: Zátoka sviní
Podívejme se na příklad z historie, kde bylo hodně nejistoty a jak se s ní tehdy vypořádali. Zátoka sviní, rok 1961. Někteří z nás si na to matně vzpomínají.
Kubánská revoluce byla v roce 1959, kdy se Fidel Castro chopil moci. A pak v letech 1960 a 1961 CIA plánovala použít 1500 kubánských exulantů, které dodala, k invazi na Kubu v Zátoce sviní. Vlastně jsem byl v Zátoce sviní, krásné místo.
Prezident Kennedy, když nastoupil do úřadu v roce 1961, o tom nic nevěděl. Bylo to utajeno před všemi. Armáda o tom nic nevěděla. Kennedy se o tom dozvěděl a nebyl o tom vůbec přesvědčen. A požádal o zprávu zpravodajských služeb od sboru náčelníků štábů a ti byli docela pesimističtí. Mysleli si - a mám z toho v knize pěkný citát - že šance na úspěch byly asi 30 ku 70, asi 70% šance na neúspěch.
Bohužel, než se ta zpráva dostala ke Kennedymu, 30% šance na úspěch byla nahrazena frází “slušná šance na úspěch”, čímž údajně mysleli “nic moc”. No, nevím, jak interpretujete slušnou šanci, ale mně to zní docela dobře.
Kvůli těmto důvodům a skupinovému myšlení Kennedy nakonec invazi schválil a bylo to naprosté fiasko, naprosté a trapné selhání. Povzbudilo to Kubánce, aby pozvali Rusy, aby tam umístili jaderné střely, a málem to vedlo k jaderné válce v následujícím roce. Bylo to jen tak tak, že jsme se vyhnuli nejbližšímu bodu k jaderné válce, jakému jsme kdy byli.
Takže to byla naprostá katastrofa. A hodně z toho bylo kvůli komunikaci nejistoty, vyjmutí čísel.
Slova versus čísla v komunikaci nejistoty
Pointa je, že slova “mohl by”, “možná”, která všichni používáme, jsou různými lidmi opravdu špatně chápána. A tak je zajímavé, že slova jako “pravděpodobně” se nyní stala standardizovanými.
Jsou standardizována v oblasti klimatických změn, jsou standardizována v různých oblastech. Takže pokud pracujete pro MI5 nebo MI6 a řeknete, že něco je pravděpodobné, myslíte tím 55% až 75% šanci. Musíte to tak myslet, jinak to nepoužijete.
Důvod, proč to vím, je, že jsem měl přednášku v MI5 a oni mi dali hrnek. Je to oficiální hrnek MI5. A ukazuje, že:
- Když máte na dně jen trochu kávy, je to více než 95%, což znamená, že je téměř jisté, že potřebujete doplnit
- 55 až 75% znamená, že je pravděpodobné, že potřebujete doplnit
Pamatujete si na hodnocení Zátoky sviní? To bylo 30%. To by bylo v britských zpravodajských službách oficiálně komunikováno jako “nepravděpodobné”, že uspěje, což je obrovský krok vpřed.
Jiní lidé mají tyto stupnice. Existuje celá řada stupnic používaných NATO, v podstatě podobné stupnice. Takže jsme už ušli dlouhou cestu. Ale to jsou opět subjektivní úsudky, ne skutečné pravděpodobnosti. Jsou to čistě subjektivní úsudky.
Test bodování nejistoty
Chci ověřit, zda dokážete posoudit svou nevědomost. Položím vám řadu otázek a každá má dvě odpovědi, A nebo B, a doufám, že neznáte odpověď.
Je tu A nebo B a vy máte říct, která odpověď je podle vás nejpravděpodobnější. A pak, pokud si myslíte, že je to A, musíte uvést svou jistotu. Řeknete 10 z 10, pokud jste si absolutně jisti, že je to A, a 5 z 10, pokud nemáte tušení. Pak vám řeknu odpověď a vy si ohodnotíte své odpovědi.
Toto je pravidlo bodování, které je dílem naprostého génia. Vyvinul ho meteorolog Breyer v podobném formátu. Je to Breyerovo bodovací pravidlo, vyvinuté v roce 1951 k hodnocení meteorologů. Je to bodovací pravidlo používané ve všech superforecastingových soutěžích Tetlockem a dalšími lidmi.
Takže pokud řeknete, že jste si jisti 10 z 10, a máte pravdu, získáte 25 bodů. Pokud řeknete, že jste si jisti 10 z 10, a nemáte pravdu, ztratíte 75. Je to opravdu kruté asymetrické bodovací pravidlo. Je to jako učitel, který, když se vám daří, řekne, “oh, ano, dobře”, ale když se vám nedaří, srazí vás jako tuna cihel.
Otázky pro publikum
Položím vám několik otázek:
- Co je vyšší, Eiffelova věž nebo Canary Wharf?
- Odpověď: A (Eiffelova věž)
- Kdo je starší? Princ z Walesu nebo princezna z Walesu (William nebo Kate)?
- Odpověď: B (Kate je o šest měsíců starší než William)
- Co váží víc? Londýnský patrový autobus (prázdný) nebo dva průměrní samci afrických slonů?
- Odpověď: A (autobus je těžší než dva sloni)
- Co je větší, Belgie nebo Švýcarsko? (Ignorujte hory, mluvíme jen o ploše)
- Odpověď: B (Švýcarsko je větší)
- Co je větší, Venuše nebo Země, co se týče poloměru?
- Odpověď: B (Země je větší)
Výsledky testu
Kdo získal více než 50 bodů? Více než 70? Dobře, takže tihle lidé buď mají velké štěstí, nebo něco vědí.
Dělal někdo hlavně jen pětky a šestky? Možná občas sedmičku? Jsou docela opatrní, a tak se drželi kolem nuly. Kdo je opatrný, opatrný odhadce? To jsou opravdu dobří. To jsou spolehliví lidé, protože vědí, co nevědí.
Je tu třetí typ člověka a ti mohou mít tendenci získávat záporné body. Kdo získal záporné body? Šimpanz by dopadl lépe než to. (Někdo získal -129 bodů)
Lidé, kteří získávají velmi nízké skóre, jsou lidé, kteří si myslí, že něco vědí, ale nevědí. A tohle je to, co toto cvičení ukazuje. Tyto druhy cvičení se používají jako trénink pro zpravodajské analytiky, aby přestali být tak přehnaně sebevědomí, přestali být tak namyšlení.
Matematika za bodováním
Jaký je vzorec za tím bodovacím pravidlem? Pokud chcete odečíst 25 od všech čísel v tabulce, dostanete: 0, -1, -4, -9, -16, -25. Jaký je ten vzorec? Jsou to čtverce. Je to čtvercová ztráta chyby.
Můžete dokázat, že potřebujete čtverec. Pokud byste použili jen lineární bodovací pravidlo, které by šlo 25, 20, 15, 10, ve skutečnosti by to lidi povzbuzovalo k přehánění. Kdyby si byli jisti 7 z 10, řekli by 10 z 10 a to by zvýšilo jejich očekávané skóre. Ale toto bodovací pravidlo podporuje upřímnost. Pokud jste si jisti na 70%, řeknete, že jste si jisti na 70%.
Takže co má tohle ukázat, je, že můžete posoudit pravděpodobnosti, které vyjadřují vaši nevědomost, vaši míru přesvědčení a vaši míru nevědomosti, a můžete použít bodovací pravidlo k posouzení těchto pravděpodobností. Neexistují žádné skutečné pravděpodobnosti. Jsou to naprosté konstrukty - prostě jste si je vymysleli. Ale můžete použít skóre k jejich posouzení.
O štěstí
Fascinuje mě štěstí. Tím nemyslím štěstí ve smyslu lidí, kteří si myslí, že existuje nějaká vnější síla. Myslím tím jen retrospektivní pohled na to, co se stalo. A posouzení, “páni, to bylo štěstí”, ve smyslu něčeho, co bylo neočekávané, co bylo mimo vaši kontrolu, a přesto to bylo dobré nebo špatné.
Příběh mého dědečka
To je můj dědeček, Cecil Spiegel, v první světové válce. Měl tu smůlu, že se narodil právě ve správném věku, aby se mohl zúčastnit první světové války jako voják, což byla docela smůla, myslím.
A pak měl strašnou smůlu, že byl ve špatnou dobu na špatném místě. Skončil jako brigádní plynový důstojník v Ypres Salient těsně po bitvě u Passchendaele v roce 1918. A musel udělat zkoušku, aby se kvalifikoval jako brigádní plynový důstojník, což musela být práce s životností pár týdnů, protože musel celou dobu chodit mezi zákopy vystavenými dělostřelecké palbě a kontrolovat plynová zařízení. A vydržel v té práci tři týdny.
Vedl si deník a napsal: “Těsný únik, štěstí, že jsem se dostal včas. Zkáza.” Měl opravdu štěstí. Den za dnem dělal tuhle práci, byl ostřelován a oni ho minuli a pak ne. 19. ledna šel do Eagle Trench a Bear Trench, které jsme vlastně navštívili, a byl ostřelován.
Teď můžete poznat podle toho, že deník pokračuje a podle toho, že jsem tady, že granát nedopadl přímo na něj - on byl vyhozen do vzduchu a byl evakuován zpět. A prohlásil B2 a minul, pak byl držen mimo přední linie.
A vlastně neuvěřitelný kus štěstí bylo, že jinak by byl jeho prapor poslán na Sommu, která byla v té době klidným sektorem. Ale v březnu 1918 se setkal s milionem německých vojáků, kteří přicházeli v císařské ofenzívě, a jeho prapor musel dvakrát přejít do protiútoku. A on byl druhý poručík, podporučík. A musel by být první na žebříku, foukat na svou malou píšťalku a povzbuzovat své muže a já bych tady nebyl. Nevím, koho byste poslouchali, ale já bych to nebyl.
Typy štěstí
Co to odhaluje, jsou různé typy štěstí. Měl smůlu, nebo štěstí? Líbí se mi definice: “operace náhody brané osobně”. A je to něco, co souvisí s tím, že je to nepředvídatelné. Je to něco, co nemáte pod kontrolou, a přesto to má dopad. A my to zažíváme neustále v našich životech.
Filozofové identifikovali typy štěstí. A to se mi opravdu líbí:
-
Konstitutivní štěstí - je prostě to, kým jste se narodili, což je naprosto základní. Nežádali jste, abyste se narodili, nevybrali jste si svou rodinu. Tady jste, vyšli jste ven nějakou náhodnou událostí. Toto je nesmírně důležité.
Chci říct, umíte si představit dítě, které se teď narodí do pěkné rodiny ve Velké Británii? Existuje mnoho míst na světě, kde by nebylo skvělé se narodit. A spousta období v historii, kdy nebyla velká šance se narodit.
Myslím, že jsem měl obrovské konstitutivní štěstí, že jsem se narodil jako součást generace baby boomers. Snědli jsme celý koláč, všechno nám vycházelo. Můj dědeček měl špatné konstitutivní štěstí, co se týče doby, kdy se narodil.
-
Situační štěstí - být na správném místě ve správný čas, nebo na špatném místě ve špatný čas. Dědeček měl velmi špatné situační štěstí, protože byl na místě, kam dopadl granát.
-
Výsledné štěstí - měl fantastické výsledné štěstí, prostě se to tak pro něj v té době vyvinulo.
Příběh havárie letadla
Tato havárie letadla - nejsem dost starý, abych si ji pamatoval, ale je to docela známá havárie letadla, kdy DC3 vletělo do Saddleworth Moor v roce 1949 v husté mlze. A na palubě byl můj přítel a statistik, profesor Stephen Evans. Mnoho lidí ho možná zná. Pracoval jsem s ním. Úžasný, úžasný člověk.
A byl v tom letadle, když vletělo do vřesoviště. Stephenovo štěstí:
- Měl hrozné situační štěstí, že byl v tom letadle v té době
- Měl fantastické výsledné štěstí, protože přežil - opravdu nepravděpodobné
Tak kde se bere konstitutivní štěstí? Konstitutivní štěstí je, protože jeho otec byl v RAF a věděl, že nejbezpečnější místo v letadle je vzadu a vždycky nutil svou rodinu sedět vzadu. A přežili jen lidé v zadní řadě. Všichni ostatní zemřeli. Takže se prostě narodil do správné rodiny.
Důležitost konstitutivního štěstí
Smysl konstitutivního štěstí, myslím, je, že vždycky si rádi myslíme, že naše úspěchy jsou výsledkem naší tvrdé práce. A rád bych si myslel, že jakýchkoli úspěchů jsem dosáhl, bylo to všechno díky mému veškerému úsilí, které jsem vynaložil. Ale ve skutečnosti musíme přiznat, že obrovská část našeho úspěchu, nebo čehokoli v životě, nebo našich obtíží, které jsme v životě měli, je prostě dána tím, kým jsme se narodili.
Takže vám zbývá ten pocit, že musíte co nejlépe využít karty, které vám byly rozdány, což je populární fráze, ale myslím, že je to docela dobrá fráze, protože je to dobrá analogie, protože všichni jsme jedineční, biologicky jedineční.
Unikátnost zamíchaných karet
Všichni jsme jedineční. Dokonce i jednovaječná dvojčata budou mít velmi odlišné zdravotní výsledky. Nejsou úplně stejná. A proč je to dobrá analogie? Protože každé zamíchání karet je v podstatě jedinečné.
Takže nikdo v celé historii lidstva nikdy předtím nezamíchal karty do tohoto pořadí. Nikdo v celé historii lidstva nikdy předtím nezamíchal karty ani do tohoto pořadí. Jsem si jistý, nemohu být logicky jistý, ale jsem si jistý, vsadil bych všechny peníze na světě, jak jsme říkávali, když jsme byli malí.
Nikdo to nikdy předtím neudělal. Takže jediný způsob, jak o tom přemýšlet - není to jen tak, že to nikdo předtím neudělal, nikdy v celé historii. Tady dvě zamíchání nebyla provedena stejně, nikým, nikdy. A o tom mohu být opravdu, opravdu přesvědčený. Proč?
Protože stačí spočítat počet zamíchání:
- První karta v zamíchání může být kterákoliv z 52
- Druhá, kterákoliv z 51
- A tak dále
- A dostaneme 52 faktoriál
Vždycky říkám, že byste si měli vytáhnout kalkulačky a začít zadávat to číslo, a velmi brzy se zaplní obrazovka a po chvíli váš telefon exploduje při pokusu o výpočet, protože je to velmi velké číslo. Je to asi tolik, kolik je atomů v naší galaxii. Počet zamíchání.
V knize dělám nějaké výpočty a ukazuji, že kdyby všichni v celé historii lidstva nedělali nic jiného, než míchali karty, šance, že by kdokoli kdykoli měl stejné zamíchání, je 10 na minus 19, zhruba, takže to je v podstatě tak blízko nule, jak jen může být jakákoli praktická věc.
Kontrast intuice
Takže je to mimořádné, a toto je situace docela často - jsme překvapeni, že věci jsou tak nepravděpodobné, jak jsou. A co to opět ukazuje, je, že naše intuice o pravděpodobnosti je hrozná.
A lidé říkají, proč lidé považují pravděpodobnost za tak obtížnou a neintuitivní? Je to proto, že je obtížná a neintuitivní. Konečně jsem na to přišel po 50 letech práce na tom. Je to obtížné a neintuitivní. A není to intuitivní, protože jsme si to stejně vymysleli, takže to je moje věc.
Koincidence
Mám docela rád koincidence. Proč se dějí? Mně se nedějí, protože téměř všechny koincidence jsou o lidech. Ne všechny, ale hodně z nich je o tom, že si lidé všímají věcí:
- “Oh, seděl jsem vedle někoho a on chodil do stejné školy”
- “Jel jsem na dovolenou a můj přítel tam byl”
Já si nikdy ničeho nevšímám. Nikdy s nikým nemluvím, když cestuji. Nevšiml bych si, kdyby moje děti byly ve stejné místnosti. Pořád se takhle potuluji. Takže se mi nikdy nestanou, protože jsem tak nepozorný.
Ale dostal jsem šest vajec s dvojitým žloutkem. Co na to říkáte? Jedno z tisíce vajec má dvojitý žloutek. Takže když se to stalo dříve, objevil se novinový článek, který říkal, že to musí být šance jedna k milionu milionů milionů, že se to stane. No, nemyslím si. Kdyby to bylo tak málo, nikdy by se to nestalo. Muselo by se to stát asi každých 500 milionů let. Ale dostal jsem 6 vajec. Takže vám později řeknu, jak jsem to udělal.
Matematika koincidencí
Někdy můžeme spočítat matematiku pro koincidence. Toto je docela běžný příběh: Lidé mají tři děti v rodině do 18 let a všechny mají stejné narozeniny.
Tato rodina, všichni se narodili 29. ledna - Robin, Ruby a Rebecca. Takže jaká je šance, že se to stane?
Mohli byste říct, no, Robin nastavil datum, protože na 29. lednu není nic zvláštního. A tak pravděpodobnost, že se Rebecca narodila v ten den, za předpokladu rovnoměrného rozložení dat, je 1 ku 365. Pravděpodobnost, že se Ruby narodila v ten den, za předpokladu rovnoměrného rozložení, což je docela velký předpoklad, je 1 ku 365. Vynásobte to, dostanete asi jednu ku 135 007. Asi sedm ku milionu šance, že se to stane.
Ale vždycky s těmito koincidencemi bychom měli říct: “Jo, je to úžasné pro ně. Je tak úžasné o tom slyšet? Je tak úžasné číst tento článek?” Takže co musíte udělat, je podívat se na to, kolik rodin se třemi dětmi je. V Británii je asi milion rodin se třemi dětmi do 18 let. Takže to znamená, že v kteroukoli dobu je jich asi osm, kteří mají tři děti se stejnými narozeninami. Jen podle Poissonova rozdělení.
Takže nevíme, kdo to jsou. Ale jen náhodou se to stalo. A pak, když to začnete googlovat, objeví se všude. Daily Mail dokonce uvedl, že šance byly 48 milionů ku jedné. Tak co udělali? Přidali další 1 ku 365, což je samozřejmě irelevantní. Kdyby to bylo opravdu 48 milionů ku jedné, nestávalo by se to stále dokola. Je to vzácné, ale ne tak vzácné.
Můj oblíbený příklad pro toto byl 19. září, což byl den vydání mé knihy. A to byla jen náhoda, protože je to vlastně Den lovců. Den lovců je úžasný den. Lovci z Whitby je nejpozoruhodnější rodina. Oba se narodili, pan a paní Hunt Rossovi, 19. září 1600. Oba se vzali 19. září 1620. Měli 12 dětí a oba zemřeli 19. září 1680, na své společné 80. narozeniny. Oba zemřeli v ten den.
Zoufale chci vědět, co se stalo. Nevím, byla otrávená dort? Zhroutila se podlaha na večírku? Co se stalo v ten den? A když půjdete do Whitby, jsou tam všechny ty věci o Drákulovi. Ale jděte nahoru ke kostelu poblíž opatství, k farnímu kostelu, a najdete tam tento památník Lovcům, kteří by si myslím měli být ve Whitby nesmírně oslavováni.
Toto je pěkný příklad. Joyce a Ron Pulsfordovi, pár, oběma bylo 80 let 8. 8. Byl jsem požádán, abych spočítal, jaká je šance, že se to stane? Myslím, že jsem dělal nějaké výpočty, ale každopádně, je to docela nepravděpodobné, aby se to stalo. Je to úžasný příklad náhody.
Narozeninový paradox
Narozeninové koincidence se ale dějí hodně. Víme, že:
- Pokud máte 23 lidí v místnosti, je 51% šance, že dva z nich mají stejné narozeniny
- 35 lidí je 81% šance, že dva sdílejí narozeniny
- 80 lidí znamená 99,99% šanci, že dva lidé sdílejí narozeniny
Takže je naprosto jisté, že dva lidé v této místnosti sdílejí narozeniny. Stačí jen 80 lidí a je 99,99% šance. Protože náhodnost je shluková - není to tak, že narozeniny jsou pěkně odděleny třemi dny.
Užitečná matematika pro výpočet koincidencí
Je to velmi užitečný výpočet, velmi užitečná část matematiky. Můžete tyto druhy výpočtů provádět docela rychle.
Velmi užitečné pravidlo je, že pokud existuje mnoho příležitostí pro to, aby se událost stala (vzácná událost), a očekávané číslo, které očekáváte, že se stane v průměru, je M, pak šance, že nedojde k žádným událostem, je E na minus M. (E je Eulerovo číslo 2,718)
Takže rychlý důkaz pro ty, kteří se zajímají:
- Pokud by to byly nezávislé vzácné události, N, každá s pravděpodobností P výskytu
- Očekáváte m = np
- Šance, že se žádná nevyskytne, je (1 - p)^n = (1 - m/n)^n
- Což se pro velké n blíží e^(-m)
Co budeme dělat, jsou závislé události. Nejsou nezávislé. Ale to je také v pořádku, protože pokud předpokládáte, že počet událostí je přibližně Poissonův s průměrem M, pravděpodobnost nulových událostí je e^(-m) z Poissonova rozdělení.
Příklad: 23 lidí a stejné narozeniny
S 23 lidmi můžu v podstatě udělat výpočet v hlavě, nebo alespoň s kalkulačkou:
- 23 lidí znamená 23 × 22 ÷ 2 = 253 párů
- Každý pár má pravděpodobnost 1 ku 365 shody
- Očekávaný počet shod je 253 ÷ 365 ≈ 0,69
- e^(-0,69) ≈ 0,5 (50%)
Takže je asi 50% šance na shodu. Můžete tyto výpočty provést pro libovolné číslo opravdu rychle na kalkulačce.
Příklady z reálného světa
V ženském mistrovství světa lidé obvykle mluví o 23, protože je 23 lidí na fotbalovém hřišti - dva týmy po 11 a rozhodčí. Takže polovina všech fotbalových zápasů má dva lidi se stejnými narozeninami.
Ale také na mistrovství světa má tým 23 členů, což je pěkné. Takže když se podíváte na ženské mistrovství světa, měli 32 týmů, každý s 23 členy. Očekávali byste, že asi polovina týmů bude mít někoho se stejnými narozeninami. A 17 přesně to mělo.
Brazílie, Kolumbie, Dánsko měly dva páry sdílených narozenin. Maroko a Nigérie měly tři páry. A Nigérie je krásná - jsou tam dvě, které se narodily na Štědrý den a jedna se jmenuje Christie a druhá Glory, což je krásné.
Experiment s publikem
Pokud máte 20 lidí, pak je 87% šance, že pokud se podívají na poslední dvě číslice svého telefonního čísla, dojde ke shodě.
Požádám vás, abyste se otočili ke svému sousedovi na každé straně a řekli své narozeniny a poslední dvě číslice svého telefonního čísla. A jen si poznamenejte, pokud dostanete shodu nebo o jednu vedle.
Analýza experimentu
Řekněme, že je tady 200 lidí. To znamená, že je tu 400 párů sousedů. Takže je tu 400 srovnání, která byla provedena.
Podívejme se na poslední dvě číslice jejich telefonního čísla:
- Je 1 ku 100 šance na shodu
- Takže by měly být zhruba čtyři páry lidí, kteří mají stejné poslední dvě číslice svého telefonního čísla
- Pravděpodobnost, že by nebyly žádné shody, je e^(-4), což je téměř nula
Podívejme se na narozeniny:
- 400 párů, 1 ku 365 šance na shodu
- Očekávaný počet = 400/365 ≈ 1,1
- Šance na alespoň jednu shodu je 1 - e^(-1,1) ≈ 67%
- Takže je asi 2/3 šance, že jsou dva lidé sedící v publiku se stejnými narozeninami, sedící vedle sebe
Hra Trace: test matematické intuice
Tato hra se hrávala kolem roku 1700. Někdo měl všechny trefy a někdo jiný měl všechny kára a zamíchali je a hráli snap. Takže prostě otáčeli karty po jedné a pokud měli stejné (oba otočili čtyřku nebo oba otočili šestku), tak řekli “snap” nebo “trace”.
Myslíte si, na co byste si raději vsadili, že bude shoda? Kdo by si raději vsadil, že bude shoda? Kdo si myslí, že je pravděpodobnější, že nebude shoda?
Udělejme si výpočty:
- Je tu 13 karet
- Šance, že se jakýkoli konkrétní pár shodne, je 1 ku 13
- Ale je tu 13 příležitostí, aby se to stalo
- Očekávaný počet shod je 13 × (1/13) = 1
- Šance, že nedojde k žádným shodám, je e^(-1) = 0,37 (37%)
- Šance, že je alespoň jedna shoda, je 0,63 (63%)
Takže lidé, kteří řekli, že si myslí, že bude shoda, by vyhráli téměř dvě třetiny případů.
Ale všimněte si jedné věci - nezáleželo na tom, kolik karet tam bylo. 13 nevstupuje do výpočtu, protože je to 13 krát 1 ku 13. Pokud by každý člověk měl celý balíček karet, 52, a otáčel je po jedné, je stále 63% šance, že dostanou shodu.
Dokud je jich více než pět, nezáleží na tom, kolik jich tam je. Říká se tomu problém s kontrolou klobouků a pochází z originálu, kde si lidé kontrolovali klobouky v opeře a pak všechny lístky prostě předali zpět, spadly dolů a byly předány náhodně. Jaká je šance, že alespoň jedna osoba dostane svůj vlastní klobouk? Je to 63% bez ohledu na to, kolika lidem byly předány klobouky.
Euler vypracoval přesný vzorec. Eulerova práce na tomto je opravdu pěkná. Vypracoval součet řady, která velmi rychle konverguje k jedné lomeno E.
Derren Brown a 10 panen v řadě
Derren Brown, iluzionista, jednou předvedl trik - hodil mincí a desetkrát po sobě padla panna. Vypadalo to jako jeden nepřerušovaný záběr.
Jak to udělal? Byla tam dlouhá série, kde nedostal 10 panen v řadě. Viděli jsme jen tu část, kde hodil a dostal 10 v řadě.
Deset panen v řadě - předpovědět sérii deseti panen v řadě a pak to uskutečnit je velmi nepravděpodobné. Šance, že se to stane, je asi jedna ku tisíci. Pokud však hodíte mincí tisíckrát a zaznamenáte výsledky, někde v té řadě panen a orlů se s velkou pravděpodobností objeví série deseti panen.
Abyste pochopili systém, musíte pochopit, že můžeme vědět jen to, co vychází z naší vlastní omezené zkušenosti. A naše zkušenost může být často velmi vzdálená pravdě.
To, co jsme viděli, byla poslední minuta toho, co byl mučivě dlouhý den. Natáčeli přes devět hodin, až nakonec se nemožné stalo nevyhnutelným.
Myslíte, že měl štěstí nebo smůlu, že mu to trvalo devět hodin? Myslíte si, že to byla dlouhá doba, nebo si myslíte, že to mohl zvládnout dříve?
Analýza trvání pokusu
Pravděpodobnost, že uspěje, je zhruba jedna ku tisíci při jakémkoli konkrétním pokusu. Pokus je něco, co končí orlem, ale v průměru byste očekávali, že to bude trvat 1000 pokusů. Ale kolem tohoto průměru je obrovská variace.
Počítám, že mu to trvalo asi 1600 pokusů, protože jsem natočil, jak dlouho mu trvalo hodit a kolik pokusů za devět hodin. Myslím, že měl smůlu, že mu to trvalo tak dlouho, protože v průměru by to měl zvládnout asi za tisíc.
Můj kolega James Grime tento výkon zopakoval. Zvládl to za hodinu a je to na YouTube. Takže to zvládl - trvalo mu to jen hodinu.
Jak to můžeme spočítat? Používáme to, co je známé jako geometrické rozdělení, což je čekací doba předtím, než se něco stane poprvé:
- Pravděpodobnost úspěchu v jakémkoli konkrétním pokusu je p = 1/1024
- Pravděpodobnost, že se mu to povede hned napoprvé, je p
- Pravděpodobnost, že to udělá při druhém pokusu, je (1-p) × p (poprvé selhal, podruhé uspěl)
- Pravděpodobnost, že první úspěch je při n-tém pokusu, je (1-p)^(n-1) × p
A to je geometrické rozdělení. Nejpravděpodobnější čas je hned první hod. To je nejpravděpodobnější čas, kdy dostanete 10 hodů v řadě, je hned první hod, protože pokud to má trvat déle, museli jste dříve selhat.
Závěr: Kde jsem sehnal vajíčka s dvojitými žloutky?
Koupil jsem si krabici vajec s dvojitými žloutky. Vím, že je to trochu jako mince se dvěma hlavami. Je to podvod. A kontroloval jsem to - můžete je sehnat od Waitrose, můžete je sehnat od Tesco’s. Levnější v Tesco’s.
A teď doporučuji trik. Kupte si krabici těchto vajec a pak se vpližte do domu přítele a vyměňte vejce a oni řeknou: “Panebože, to je další dvojitý žloutek.” Je to skvělý vánoční trik.
Hodně štěstí. Děkuji vám mnohokrát.
Kritické zhodnocení přednášky Davida Spiegelhaltera o “Umění nejistoty”
David Spiegelhalter je uznávaným statistikem a popularizátorem vědy, který se dlouhodobě věnuje otázkám pravděpodobnosti, rizika a nejistoty. Ve své přednášce vycházející z knihy “The Art of Uncertainty” představuje svůj pohled na povahu pravděpodobnosti a způsoby, jakými lidé vnímají a interpretují náhodu a nejistotu ve svých životech. Následující zhodnocení se zaměřuje na hlavní teze přednášky a jejich vztah k současnému stavu poznání.
Pravděpodobnost jako subjektivní konstrukt
Silné stránky argumentace
Spiegelhalterovo tvrzení, že “pravděpodobnost neexistuje” a je spíše subjektivním konstruktem než objektivní vlastností světa, staví na bayesovském přístupu k pravděpodobnosti. Toto pojetí má v současné statistice silné postavení a je teoreticky dobře podložené. Jeho odkaz na De Finettiho je historicky přesný - Bruno de Finetti byl skutečně jedním z hlavních zastánců subjektivního pojetí pravděpodobnosti.
Použití dvojhlavé mince jako ilustrace rozdílu mezi aleatorní a epistemickou nejistotou je pedagogicky efektivní a konceptuálně správné. Toto rozlišení je v souladu s moderními teoriemi nejistoty a je uznáváno napříč různými obory včetně rozhodovací teorie, ekonomie a statistiky.
Potenciální kritické body
Přestože Spiegelhalter prezentuje subjektivní bayesovský přístup jako svůj preferovaný rámec, poněkud opomíjí diskuzi o alternativních pohledech na pravděpodobnost, zejména frekventistické stanovisko, které má v mnoha vědních oblastech stále významnou roli. Ačkoliv zmiňuje, že existují různé definice pravděpodobnosti, neposkytuje vyvážený pohled na jejich relativní výhody a nevýhody.
Tvrzení, že “pravděpodobnost neexistuje”, je možná příliš silné a filozoficky sporné. Zatímco De Finettiho přístup je legitimní, mnozí teoretici by argumentovali, že i když je pravděpodobnost lidským konstruktem (jako ostatně všechny matematické koncepty), odráží reálné vzorce ve světě a má objektivní aspekty. Současné výzkumy v oblasti kvantové mechaniky a teoretické fyziky naznačují, že některé pravděpodobnostní jevy mohou existovat nezávisle na lidském pozorování.
Komunikace nejistoty
Silné stránky argumentace
Příklad Zátoky sviní jako historické ukázky špatné komunikace nejistoty je přesný a dobře zdokumentovaný v historické literatuře. Spiegelhalterova kritika použití vágních výrazů (“slušná šance”) místo číselných vyjádření je v souladu s aktuálními doporučeními pro komunikaci pravděpodobnosti v oblastech jako je zpravodajství, meteorologie a medicína.
Jeho poukaz na standardizaci výrazů ve zpravodajských službách a v komunikaci klimatických změn je fakticky správný a odráží současnou praxi v těchto oblastech.
Potenciální kritické body
Ačkoliv Spiegelhalter správně zdůrazňuje důležitost přesné komunikace nejistoty, poněkud přeceňuje schopnost lidí efektivně pracovat s číselnými pravděpodobnostmi. Novější výzkumy v oblasti kognitivní psychologie (např. Gigerenzer, 2015) naznačují, že pro mnoho lidí jsou přirozené frekvence (např. “2 z 10 případů”) srozumitelnější než procentuální vyjádření.
Spiegelhalter dále nezmiňuje důležitost kontextu při interpretaci pravděpodobnostních výroků - tatáž numerická hodnota může být interpretována různě v závislosti na závažnosti potenciálních důsledků, jak ukazují např. studie Slovice a kolegů (2004).
Bayesovské bodovací pravidlo a kalibrace nejistoty
Silné stránky argumentace
Spiegelhalterova demonstrace Breyerova bodovacího pravidla je matematicky správná a pedagogicky účinná. Použití tohoto pravidla v “superforecastingu” a při hodnocení meteorologických předpovědí má skutečně empirickou podporu v literatuře (Tetlock & Gardner, 2016).
Jeho vysvětlení, proč kvadratická ztrátová funkce podporuje upřímnost a brání přehánění jistoty, je matematicky korektní.
Potenciální kritické body
Zatímco Spiegelhalter správně popisuje matematiku bodovacího pravidla, příliš nezmiňuje jeho omezení. Novější výzkumy v oblasti verifikace pravděpodobnostních předpovědí (např. Gneiting & Raftery, 2007) naznačují, že neexistuje jediné univerzálně optimální bodovací pravidlo a volba pravidla by měla záviset na kontextu a účelu předpovědi.
Koncept štěstí a náhody
Silné stránky argumentace
Spiegelhalterovo rozdělení štěstí na konstitutivní, situační a výsledné je koncepčně užitečné a odráží filozofické diskuse o roli náhody v lidských životech (ačkoliv explicitně neodkazuje na filozofickou literaturu).
Jeho analýza nepravděpodobnosti identických zamíchání karet je matematicky správná a ilustruje důležitý bod o obrovském počtu možných kombinací v relativně jednoduchých systémech.
Potenciální kritické body
Přestože Spiegelhalterovo rozlišení typů štěstí má intuitivní přitažlivost, chybí zde explicitní propojení s existující filozofickou a sociologickou literaturou na toto téma. Koncept “konstitutivního štěstí” má silnou paralelu s konceptem “morálního štěstí” filozofa Thomase Nagela a s prací Johna Rawlse o spravedlnosti a rovnosti příležitostí, což by posílilo jeho argumentaci.
Jeho diskuse o štěstí také opomíjí kulturní rozdíly v chápání náhody a štěstí, které jsou dobře zdokumentovány v antropologické literatuře (např. práce Mary Douglasové).
Pravděpodobnost koincidencí a narozeninový paradox
Silné stránky argumentace
Spiegelhalterovo vysvětlení narozeninového paradoxu a jeho matematické odvození je přesné a dobře prezentované. Jeho použití Poissonova rozdělení pro aproximaci je matematicky vhodné a standardní v této oblasti.
Empirická validace těchto výpočtů na příkladu týmů na mistrovství světa je zajímavá a podporuje teoretické předpoklady.
Potenciální kritické body
Při diskusi o narozeninovém paradoxu Spiegelhalter předpokládá rovnoměrné rozdělení narozenin v průběhu roku, což je běžný předpoklad, ale ne zcela přesný. Výzkumy (např. Diaconis & Mosteller, 1989) ukazují, že narozeniny nejsou zcela rovnoměrně rozloženy, přičemž některé měsíce mají vyšší frekvenci než jiné. Toto může mírně ovlivnit výpočty, ačkoliv efekt je obvykle malý.
Při diskusi o “shlukování náhodnosti” mohl Spiegelhalter více zdůraznit, že zdánlivé shluky jsou často náhodným jevem, který lidský mozek mylně interpretuje jako vzor - což je dobře zdokumentovaný kognitivní jev známý jako “klam klusteru” nebo “apofenie”.
Derenem Brownův trik a geometrické rozdělení
Silné stránky argumentace
Spiegelhalterova analýza triku Derena Browna s 10 pannami v řadě je matematicky správná a dobře ilustruje princip geometrického rozdělení. Jeho odhad, že Brown potřeboval asi 1600 pokusů, je přiměřený na základě popsaných parametrů.
Potenciální kritické body
Spiegelhalter by mohl být přesnější ohledně předpokladů své analýzy Brownova triku. Implicitně předpokládá, že hody mincí jsou nezávislé a mince je spravedlivá. Zatímco nezávislost je rozumný předpoklad, spravedlivost mince není zaručena - profesionální kouzelníci často používají techniky, které ovlivňují výsledky zdánlivě náhodných procesů.
Celkové zhodnocení
David Spiegelhalter předkládá informativní a zábavnou přednášku, která úspěšně popularizuje složité koncepty pravděpodobnosti a statistiky. Jeho klíčová teze o subjektivní povaze pravděpodobnosti je podložena solidní teoretickou tradicí, i když ne všichni statistici a filozofové by s ní souhlasili v takto silné formě.
Většina prezentovaných matematických výpočtů a statistických principů je správná a v souladu se současným stavem poznání. Jeho příklady jsou dobře zvolené a efektivně ilustrují klíčové body.
Hlavní omezení přednášky spočívá v tom, že představuje primárně jeden filozofický pohled na pravděpodobnost (bayesovský subjektivismus) bez dostatečného prozkoumání alternativních pohledů. Rovněž někdy zjednodušuje komplexní psychologické aspekty vnímání pravděpodobnosti a rizika.
Přesto je jeho přednáška hodnotným příspěvkem k veřejnému porozumění statistiky a pravděpodobnosti, oblastí, které jsou často mylně chápány, ale hrají klíčovou roli v moderním rozhodování založeném na důkazech.
Reference
Ačkoliv Spiegelhalter explicitně neodkazuje na následující literaturu, tyto práce poskytují teoretický kontext a někdy i alternativní pohledy k tématům diskutovaným v přednášce:
- De Finetti, B. (1974). Theory of Probability. Wiley.
- Diaconis, P., & Mosteller, F. (1989). Methods for studying coincidences. Journal of the American Statistical Association, 84(408), 853-861.
- Gigerenzer, G. (2015). Risk savvy: How to make good decisions. Penguin.
- Gneiting, T., & Raftery, A. E. (2007). Strictly proper scoring rules, prediction, and estimation. Journal of the American Statistical Association, 102(477), 359-378.
- Nagel, T. (1979). Mortal questions. Cambridge University Press.
- Slovic, P., Finucane, M. L., Peters, E., & MacGregor, D. G. (2004). Risk as analysis and risk as feelings: Some thoughts about affect, reason, risk, and rationality. Risk Analysis, 24(2), 311-322.
- Tetlock, P. E., & Gardner, D. (2016). Superforecasting: The art and science of prediction. Random House.