Umělá inteligence pro každého

7. Vizualizace dat

Vizualizace dat je jeden z nejefektivnějších způsobů, jak zprostředkovat jejich obsah lidem. Špatně provedená vizualizace však může být naopak zavádějící. Toho je někdy i zneužíváno ve snaze o dezinformace, a proto by měl být čtenář vždy ostražitý a být schopen grafy správně číst.

Zde si uvedeme výčet základních typů grafů a specifikujeme si jejich způsob použití.

Liniový (spojnicový) graf

Liniový (někdy označovaný jako spojnicový) nebo bodový graf jsou nejčastěji používanými druhy zobrazení bodů v kartézských souřadnicích, se kterými mají všichni bohaté zkušenosti. Používají se typicky v případech, kde body mají jasně dané uspořádání a sledujeme nějaký trend. Na vodorovné ose proto bývá nejčastěji čas, ale rozhodně to nemusí být pravidlem.

Obrázek 1: Příklad liniového grafu na vývoji průměrné hrubé měsíční mzdy v České republice. Zdroj: Český statistický úřad.

Mapa

Pro vizualizaci geografických dat se nejčastěji používají mapy. Zkoumanou veličinu potom můžeme vizualizovat nezávisle pro různé mapové oblasti. Za příklad může sloužit zachycení mediánu mezd v různých krajích České republiky na obrázku 2.

Obrázek 2: Medián hrubé měsíční mzdy v různých krajích. Zdroj: https://ispv.cz.

Koláčový graf

Pokud chceme zdůraznit poměry mezi hodnotami v datech, vhodnou vizualizací může být koláčový graf.

Obrázek 3: Počty zaměstnanců, strukturované podle vzdělání, zachycené koláčovým grafem. Zdroj: https://ispv.cz.

Sloupcový graf

Pro zobrazení četností kategorických veličin jsou vhodné sloupcové grafy. Jsou to obdélníhové pruhy, jejichž délka proporcionálně odpovídá velikosti hodnot, které znázorňují.

Obrázek 4: Příklad sloupcového grafu, zobrazujícího medián hrubé měsíční mzdy podle pohlaví a věku. Zdroj: https://ispv.cz.

Krabicový graf

Krabicový graf je výhodný a často používaný pro vizualizace distribucí, kde chceme přímo zachytit kvantily a další statistiky. Jeden z používaných způsobů jejich zobrazení je zachycen na obrázku 5.

Obrázek 5: Příklad krabicových grafů pro zachycení závislosti mzdy na dosaženém vzdělání. Zdroj: https://ispv.cz.

Datová žurnalistika

Důležitým příkladem využití vizualizací dat mimo vědecké obory je datová žurnalistika. Jde o druh novinářské práce, která se zabývá sběrem, ověřováním, zpracováním a distribucí dat ve srozumitelné formě pro čtenáře.

Obrázek 6: Popis práce datových žurnalistů.

Moderní žurnalistika je často založená na datech. Tím je prezentovanému sdělení dána vyšší důvěra než u subjektivního reportování. I při konzumaci datové žurnalistiky je však nutné dbát ostražitosti a být přiměřeně kritický. I správná data je možné interpretovat zavádějícím způsobem. Příkladem kvalitní datové žurnalistiky v českém prostředí je web Českého rozhlasu: https://www.irozhlas.cz/zpravy-tag/datova-zurnalistika.