Umělá inteligence pro každého

5. Data versus intuice

Není žádným překvapením, že intuice a pocity nás často klamou. Proto je statisticky výhodnější dělat důležitá rozhodnutí na základě faktů a dat. Rozhodování na základě dat se stává čím dál důležitějším, neboť množství dostupných dat neustále roste a lidé/společnosti, které data pro rozhodování nepoužívají, začínají za ostatními zaostávat. Příkladem datově řízených firem jsou úspěšné společnosti jako Google, Meta (dříve Facebook) nebo Amazon. Rozhodování na základě dat je však důležité i mimo business ve většině oblastí lidského bytí.

Pro ilustraci a pobavení uveďme několik matematických příkladů, kde naše intuice selhává.

Úloha 1

Představme si, že natáhneme provaz kolem rovníku celé Zeměkoule. Pokud budeme považovat Zemi za přesnou kouli s poloměrem r = 6 378 km, bude délka provazu přibližně 40 074 km. Bez dlouhého přemýšlení a počítání zkuste odhadnout, jak se délka lana prodlouží, pokud budeme chtít lano táhnout všude 1 m nad povrchem Země.

Většině z nás intuice říká, že nutné prodloužení pro tak velkou kouli bude minimálně v řádu desítek kilometrů. Po jednoduchém dosazení do vzorce pro délku kružnice však zjistíme, že velikost prodloužení vůbec nezávisí na poloměru Země a prodloužení tak bude překvapivě jen 6.3 m.

Úloha 2

Ve třídě sedí 30 žáků. Jaká je šance, že alespoň 2 žáci ze třídy mají narozeniny ve stejný den?

Bez většího přemýšlení by člověk tipoval, že vzhledem k velkému počtu dní v roce bude pravděpodobnost relativně malá, ale je to jen zdání. Problém si pro jednoduchost otočíme a budeme počítat pravděpodobnost situace, kdy ve třídě nejsou žádní dva žáci se stejným datem narozenin. Poté tuto pravděpodobnost odečteme od 1.

Původně požadovaná pravděpodobnost je tedy 1 – 0,294 = 0,706.

Další příklady selhání intuice

Začátkem roku 2020 si málokdo připouštěl možnost devastujícího dopadu pandemie covid-19 na celý svět, přestože data o šíření nemoci to již jasně ukazovala. Důvodem byla absence podobné zkušenosti většiny z nás a popírání něčeho do té doby pro naši generaci tak nepředstavitelného.

Dalším příkladem zkresleného vidění reality je život v sociálních bublinách. Přitom se nemusí jednat jen o dobře známé bubliny na sociálních sítích, ale můžeme zůstat ve fyzickém světě. Jeden příklad za všechny – “Nechápu, jak mohl být zvolen politik XYZ. Neznám jediného člověka, který ho volil.”

Příklady využití dat k rozhodování v praxi

Při vývoji softwaru, a zejména při návrhu uživatelského rozhraní, se často používá takzvané A/B testování. To spočívá v tom, že se uživatelům po určitou dobu náhodně zobrazuje jedna z více variant produktu (například designu e-shopu) a sbírají se data o chování uživatelů. Poté se vybere nejúspěšnější varianta (např. na základě prodejů), která se použije pro všechny uživatele.

Ve streamovacích aplikacích jako jsou Spotify, Youtube nebo Netflix jsou pro doporučování obsahu používány algoritmy založené na sběru historických dat uživatelů. Na základě těchto dat se systém naučí uživatelské preference a ty využije pro rozhodnutí, jaké filmy, hudbu nebo produkty uživateli dále doporučit.

Natáčení nových dílů televizních seriálů se zpravidla řídí průzkumy sledovanosti nebo prodeje a nikoliv pocity tvůrců. Příkladem úspěšného televizního seriálu jsou Simpsonovi. První díl seriálu Simpsonovi byl vytvořen v roce 1987 a točí se dodnes.