Martin Večeřa

pondělí 23. listopadu 2015

#dataviz15 #6 D3.js

V hodině o základech D3.js hodně mých spolužáků tápalo. Rozhodl jsem se trochu osvětlit, jaké kroky vedly k výsledku. Zde je fiddle:

Nejprve voláme funkci d3.csv(url, callback). Ta stáhne soubor na url a zavolá funkci callback jakmile je soubor stažen.

Jako callback předáme naši vlastní funkci – tato funkce obdrží od D3 data, se kterými můžeme pracovat. Dovnitř funkce napíšeme celý náš program.

Naše funkce má jako parametr data. Přesně tam budou data z csv souboru a můžeme s nimi dále pracovat. Jsou uloženy jako pole řádků z našeho souboru. Pole je datová konstrukce ze světa programování. Umožňuje mít více hodnot v jednom objektu, jedné proměnné. Hodnoty jsou očíslované – něco jako šuplíčky s čísly.

Zdrojový CSV soubor má 2 řádky, ale protože první řádek chápe D3 jako názvy sloupců, je v našem poli právě jeden řádek. Ten získáme jako data[0]. Počítáme od nuly. Hodnota v prvním chlívečku je objekt. Objekt je si lze představit jako šuplíčky, které mají jméno. V našem případě jsou mají šuplíčky popisky roky 2000-2014. V šuplíčcích se skrývají číselné hodnoty pro jednotlivé roky. Uff.

Možná někoho napadá, že naše csv vlastně mohlo mít jako popisky sloupců “rok” a “hodnota”- V jednotlivých řádcích by pak mělo rok a hodnota. Celé by to pak bylo jednodušší. Naštěstí, protože d3 je mocný nástroj, umožní nám takovou věc udělat velice snadno. (To se na hodině neukazovalo – tj. to vylepšení v rámci DÚ).

var rows = d3.entries(data[0]);

Do proměnné rows uložíme výsledek volání d3.entries(data[0]). To je funkce d3, která udělá z objektu pole. Jak? Vezme z šuplíčku nálepku (klíč - key) a jeho obsah (value) a vloží je do nového šuplíčku v poli. Nyní tedy máme v proměnné rows uloženy jednotlivé řádky tak, jak bychom si je přáli. Každý řádek má svůj klíč a svou hodnotu.

var chart = d3.select("#chart");

Také si založíme proměnou chart. Její obsahem bude HTML element s id ‘chart’. Teď přijde složitější konstrukce:

var row = chart.selectAll('div')
        .data(rows)
        .enter()
        .append('div');

Ta říká: Z elementu chart vyber všechny elementy div (i budoucí). Ty svážeme s daty – s řádky z proměnné rows. Pak říkáme, co se má stát, když přijdou nová data (enter) – nový řádek. V tom případě se má k vybraným ‘divům’ přidat další ‘div’.

row.append('div')
        .text(function (d) {
            return d.key;
        })
        .classed('label', true);

Do každého řádku přidáme další div. To bude popisek s rokem. Nastavíme mu text. Abychom se dostali k datům, tak jako parametr předáme funkci. Ta funkce od d3 obdrží právě jeden řádek, který pochází z těch dat, které jsme svázali s každým divem. Ten řádek bude v parametru d. To je objekt – má dva šuplíčky, jeden se jmenuje key a druhý value. Jsou to přesně ty samé jako jsem o nich hovořil výše. V šuplíčku key je uložen rok a ten nás přesně zajímá. Proto vrátíme (return) hodnotu z šuplíčku d.key. Ta se použije jako text divu. Také nastavíme novému divu třídu ‘label’.

row.append('div')
        .classed('bar', true)
        .text(function (d) {
            return d.value;
        })
        .style('width', function (d) {
        return d.value / 2000 + 'px';
    });

Ke každému řádku přidáme ještě jeden div. To bude sloupec našeho grafu. Nastavíme mu třídu ‘bar’ a jako text mu vložíme hodnotu ze šuplíčku ‘value’. Předáme mu ještě styl. Tím je jeho šířka. Tedy šířka sloupce grafu. Zde by se hodila použít nějaká škála, pro zjednodušení prostě vydělíme naše data. Šířku vypočteme tak, že vydělíme hodnotu 2000, aby nebyl sloupec příliš široký.

To je z javascriptového kódu vše. Zbývá jen nastylovat náš graf, aby hodnoty pěkně vynikly.

.bar {
    background:  #99f;
    height: 20px;
    margin-bottom: 5px;
    margin-left: 50px;
    color: white;
}
.label {
    float: left;
    width: 50px;
}

body {
    font-family: sans-serif;
    font-size: 12px;
}

Výsledek:

PS: Upřímně pochybuji, že někdo z mého popisu pochopil vo co tady de. Ale alespoň jsem to zkusil. A selhal.

neděle 25. října 2015

#dataviz15 #3 Špatné grafy

Dnes netvořím, ale za úkol mám najít špatné vizualizace. Jenže kde je hledat? Zabrousil jsem rovnou na novinky.cz a tn.cz. Po překonání pocitů nevolnosti nad titulky na tn.cz objevuji první článek, co by mohl obsahovat nějakou vizualizaci: V Česku přibývá lidí nakažených AIDS. Kde je riziko největší? (tn.cz, 25.10.2015, link). Článek je to vydatný, studenti žurnalistiky by si na něm smlsli.

Na obrázku vidíme mapu ČR v červené barvě, na ní jsou vyznačeny kraje, které mají popisky čísla s počty (asi) nově nakažených HIV. Na první pohled jsem si říkal, že to je docela v pohodě graf. Pár chvil mně do očí bila červená barva. Proč je graf celý červený? Potom mi začalo docházet, že ten graf není docela v pohodě.

Stejná data by dokázala reprezentovat i tabulka. Jaké výhody má tento graf oproti ní? Orientace na mapě může být rychlejší než v tabulce – zajímá mě, jak je na tom můj kraj, hned vím, kam se podívat. V tabulce bych hledal o něco déle. Taky můžu vyzkoušet čtenáře z vlastivědy, to je super. A ta možnost ho vybarvit červenou barvou a vyslat čtenářům vážnost situace. Tabulka není nejlepší způsob reprezentace dat, v porovnáním s tímto grafem si ale vede dobře.

Kdyby kraje byly vybarveny podle počtu případů na základě nějaké škály, mělo by jeho použití větší smysl. Jenže graf nestojí ve vákuu. Měl by odpovídat na správnou otázku a reprezentovat správná data.

Předpokládejme, že otázka Kde je riziko největší? není úplně zvrácená a má opravdu smysl se ptát kde. Odpovídají na ni souhrnné počty o nakažených z let 85-15? Je na tom Praha s milionem obyvatel hůř než liberecký kraj s 400 tisíci? Asi jo, ale poměr nakažených na počet obyvatel není z grafu jasný a možnost si ho odvodit vyžaduje dost podrobnou vlastivědnou znalost i nějakou tu matematiku. Obojí by měla mít vizualizace v sobě.

Otázku nepovažuji ale za správnou, protože v nákaze HIV hraje roli spíše rizikové chování (což naštěstí článek uvádí) a ne to, kde člověk žije. Možná by se dala data zobrazit v poměru k zastoupení rizikových skupin.

Graf od tn.cz není tedy správně graficky, pracuje se špatnými daty a ptá se na nesprávnou otázku. Nápad na graf nejspíš vzešel z měsíční zprávy o HIV od Státního zdravotního ústavu. TN ho nekriticky převzala, obarvila a podpořila svou otázkou. Původní je k prohlédnutí níže.

úterý 20. října 2015

#dataviz2015 #2 Cizinci v ČR pomocí SW

Jako druhý úkol jsme již pracovali se surovými daty z ČSÚ. Připravil jsem dva grafy (bohužel mapa se mi nepodařila). Částečně navazují na předchozí hodinu.

Na prvním grafu máme možnost vidět celkový počet cizinců v ČR v závislosti na čase, který je rozdělen na dvě části – cizinci z EU a cizinci ze států mimo EU. Opět jsem pracoval s agregovanými daty od ČSÚ, protože se měnily státy EU (Bulharsko, Rumunsko, Chorvatsko).

Z grafu je patrné, že od roku 2008 je počet cizinců v ČR víceméně stejný, a že cizinci mimo EU již nepřicházejí (navazuji na graf z minulého úkolu). Nahrazují je cizinci z EU.

V druhém grafu jsem se proto zaměřil na roční přírůstek/úbytek v těchto kategoriích.

Můžeme vidět, že po roce 2008 počet cizinců ze zemí mimo EU stále klesá, zatímco ze zemí EU se po propadu obrátil k nárůstu.

#dataviz15 #1 Cizinci v ČR rukou

Za první úkol jsme dostali nahodit rukou pár grafů podle obdržených dat. Data ukazovala počet cizinců v ČR v jednotlivých letech podle země původu. Pro první graf jsem se rozhodl využít agregovaná data o počtech cizinců z EU a ostatních zemí v jednotlivých letech.

Vodorovná osa představuje počet cizinců pocházejících mimo EU, svislá ty z EU. V grafu jsou pak zaznamenány jednotlivé roky. Lze tedy vidět poměr cizinců v jednotlivých letech.

Několik prvních “křížků” vypadalo slibně – naznačovalo přímou úměru – tedy, že poměr cizinců z EU/non-EU se v čase nemění. Od roku 2009 ale nastal zvrat a graf se stal obtížně čitelným. Cizinci ze zemí mimo EU v čase začali z ČR odcházet (že by následek hospodářské krize?) a tak se naznačená přímka otočila v hokejku směrem vzhůru. Kdyby graf dělal člověk na počítači, asi by viděl všechna data najednou a nepřišlo by mu to jako dobrý nápad. Moje počáteční radost z přímé úměry byla pokažena.

Jako druhý graf jsem si vybral 3 země EU, ze kterých je v ČR nejvíce cizinců: Slovensko, Německo, Polsko a vynesl jsem na graf počty cizinců z těchto zemí v závislosti na čase.

Zde pak není co řešit. Je vidět, že po roce 2010 se růst počtu Slováků v ČR po zakolísání po roce 2008 obnovil, zatímco počet Němců a Poláků po roce 2010 spíše stagnuje.

pátek 3. července 2015

The Signal and the Noise - Book Review

Recenze knihy Nate Silver: Signal and the Noise (Signál a šum), kterou jsem zpracoval v rámci studia na FF UK.
Nate Silver, statistik a politický prognostik, ve své knize The Signal and the Noise: The Art and Science of Prediction (Penguin Books, 2013) analyzuje úspěšné a neúspěšné predikce v různých oblastech. Ukazuje na nich principy, které vedou k úspěchu, a chyby, kterých je dobré se při předpovídání vyvarovat. Název knihy Signál a šum odkazuje k přirovnání, které autor používá: Tvorbu předpovědí prezentuje jako hledání signálu uprostřed šumu. Představuje řadu principů pro správnou předpověď, za nejvýznamnější přístup považuje probabilistické smýšlení a bayesovskou logiku.

Kniha je vystavena na analýzách různých nezávislých oblastí lidského života a vědy, ve kterých se úspěšně či neúspěšně používá predikce. První tři kapitoly popisují neúspěch předpovědí, který vyústil ve finanční krizi v roce 2008, smíšené úspěchy předpovědí ve volbách a politice nebo úspěšný svět předpovědí v baseballu. Postupně uvádějí čtenáře do problému předpovědí a jejich následků. Další čtyři kapitoly se věnují predikcím v dynamických komplexních systémech: Předpověď počasí, zemětřesení, ekonomika a šíření infekčních nemocí. Autor v těchto kapitolách prohlubuje a rozšiřuje téma predikce. V kapitole 8 pak Silver představuje Bayesův teorém na ukázce sázkařství na sport a v dalších kapitolách ho aplikuje nejprve na hry šachy a poker (k. 9 a 10) a následně na složitější problémy globálního oteplování, terorismu a bublin na finančních trzích (k. 11, 12, 13). Kniha začíná úvodníkem o ekonomickém pokroku a růstu množství informací ve světě a je uzavřena zdůrazněním potřeby dobrých predikcí a přínosem aplikace bayesovské logiky.

Silver svou knihu organizuje velice dobře podle roustoucí složitosti problému. Úvodní slovo čtenáře možná více zmate, než uvede do problému, od první kapitoly je autor ale věcný, zároveň podrobný a dostatečně zdůrazňuje, co si má čtenář odnést. Postupně se dostává ke složitějším oblastem, ve kterých obtížně identifikuji, co přesně je hlavní myšlenka, kterou chce předat. Možná je to i tím, že na začátku více pojmenovává jevy, které chce zdůraznit a později je text spíše deskriptivní, aniž by vyzdvihoval některé myšlenky vůči jiným. Pro čtenáře tak může být obtížné odlišit signál a šum.
Byť kapitoly popisují odlišné oblasti lidského života, navazují na sebe principy a postupy předpovědí, které jsou v kapitolách popsány. I proto by na závěr jednotlivých kapitol pro zdůraznění sdělení mohl autor klíčové myšlenky shrnout. Na místo toho na konci kapitol spíše hovoří obecně o dopadech a vlivu předpovědí v analyzované oblasti. Shrnutí klíčových principů a možných chyb predikce na závěr kapitoly by umožnilo posílit provázanost kapitol a také umožnilo čtenáři odnést si více důležitých informací. Stejně tak by i celkový závěr knihy mohl více zopakovat klíčové myšlenky z knihy a měl by je podpořit fakty z předchozích kapitol namísto nových informací.

Snad se autor bál, aby jeho kniha nepřipomínala učebnici, a proto se neopakuje, spíše se snaží čtenáře bavit novými informacemi a příběhy. Je ovšem velice obtížné si z knihy odnést ucelenou znalost.
Knihu bych zařadil do oblasti populární naučné literatury. Autor používá srozumitelný jazyk a styl má blízko k vypravování: “But because of medicine’s intimate connection with life and death, doctors tend to be appropriately cautious. In their field, stupid models kill people.”(s. 230) Autor pečlivě anotuje převzatá tvrzení s odkazem na zdroj.

Jednotlivé oblasti a role predikce v nich jsou popsány formou příběhů. Autor také vedl rozhovory s lidmi z oblasti a popisuje jejich osobní příběhy. I proto se kniha dobře čte. Obsah je velmi dobře připraven a promyšlená struktura knihy usnadňuje proniknutí do celého oboru predikcí. Z knihy jsem měl dojem, že sleduji dobrodružství předpovídání v dnešním.

Při čtení jsem cítil, že držím v ruce opravdu kvalitní knihu od člověka s mnoha zkušenostmi. Přesto jsem ke konci knihy přemýšlel, zda její rozsah nebyl mírně nad autorovy síly. Nebyl jsem schopen přesně sledovat to, co mi chce sdělit. Celkově díky skvělému obsahu knihu hodnotím jako vynikající dílo, které si zaslouží tu pozornost, kterou si po svém uvedení získalo.

The Signal and the Noise není pro čtenáře, kteří hledají přesné návody jak tvořit predikce v popsaných oborech. Je to ale kniha vhodná pro všechny, kteří se předpovědí zabývají v libovolném oboru, nebo s predikcemi začínají a chtějí získat široký pohled na věc. Přečíst si ji lze také pro zábavu, zvlášť pokud máte zájem o dnešní společnost a společenské či přírodní vědy.

SILVER, Nate. The signal and the noise: the art and science of prediction. London: Penguin, 2013. ISBN 978-014-1975-658.

středa 31. prosince 2014

Soukromí v době internetu

Zapomenutá součást svobody

Považujeme soukromí za tak přirozenou věc, až si ho přestaneme hlídat?

V minulém roce jsme se díky odhalením Edwarda Snowdena dozvěděli o programech NSA, americké tajné služby se zaměřením na elektronickou komunikaci, které výrazně zasahují do soukromí uživatelů internetu. Dozvěděli jsme se, že má NSA přístup ke všem datům, které procházejí přes území spojených států. Potvrdilo se, co mnozí možná tušili a možná tolerovali: Soukromí na internetu je z velké části pouze iluze.

Možná právě proto, že od internetu mnoho soukromí nečekáme, nevedla Snowdenova odhalení k nějakým znatelným změnám chování na internetu. Ano, rozběhla se debata v odborných kruzích. Dokonce se k problému projevem vyjádřil Obama. Sledování telefonu Merkelové bylo v médiích také docela vidět a slyšet. Ale změnilo se nějak naše chování? Změnili jsme se my, občané států, které byly a jsou terčem sledování ze strany našeho vlastního spojence v západním světě? Máme o soukromí na internetu vůbec zájem?

Myslím, že naše reakce byla spíše vlahá. Možná, že pár zainteresovaných osob rozebralo NSA u piva či na #SNMBeer, ale nemyslím si, že byla reakce na daný problém dostatečná. Zároveň si ani nejsem jistý, jakou by měla mít formu. A navíc ani nevím, zda o soukromí na internetu máme zájem.

Nevíme jak internet funguje

V dnešním světě používáme spoustu vynálezů, aniž bychom tušili, na jakém principu fungují. Zároveň do běžného života pronikají přístroje, které jsou stále složitější. Způsobem, který nám pomáhá složité přístroje používat, jsou mentální modely. Nemusíme tedy vědět, co přesně se stane, když v autě sešlápneme plynový pedál, důležité ale je, že víme, že motor více zabere a auto jede rychleji. Tedy pokud máme zařazeno. Jen těžko bychom ale mohli auto ovládat, kdybychom neměli představu o tom, v jakém vztahu jsou pedál spojky, plynový pedál a řadící páka.

Bohužel na internet nám nikdo řidičský průkaz nevydává. Takže jen málo lidí ví, jak ve skutečnosti internet a počítače fungují. Nebo lépe řečeno, jen málo lidí má ucelený mentální model takový, aby rozuměli tomu, co se děje s jejich daty, které do svého počítače zadávají. To se projevilo například při nedávném oznámí změny podmínek používání Facebooku, kdy někteří na svůj profil umístili zprávu, že si chtějí uchovat svá autorská práva. Navíc často s viditelností pouze pro přátele. Podobně si uživatelé přeposílali hromadné zprávy o tom, že ICQ bude zpoplatněno. Kdo však údajně přeposlal zprávu nejméně 15 kontaktům, měl být zpoplatnění ušetřen. Zdá se mi to úsměvné, ale takto reaguje mnoho uživatelů. Myslím, že je to proto, že nevědí, jak to vlastně funguje.

Kde jsou naše data uložena a co se s nimi děje a může dít, je dost možná mimo představy drtivé většiny internetových uživatelů. Zároveň nerozumí pokročilým možnostem zabezpečení, jako je připojení protokolem HTTPS. Když si pak všimnou, že něco není v pořádku, je to až ve chvíli, kdy je na to upozorní sám prohlížeč. Mnozí ale ve své uživatelské znalosti umějí jít i dál, upozornění prohlížeče ignorovat a několika kliknutími jej přeskočit.

Není to jednoduché

Tak jako úplně každý problém, má i šmírování ze strany NSA dvě tváře. Složité. A rozhodnout jednoznačně o tom, co je dobré a co špatné lze jen obtížně. A protože si lidé složité problémy rádi zjednodušují, je tento problém v mnohých myslích redukován na to, že NSA nás sice šmíruje, ale zároveň tak bojuje s padouchy po celém světě. I Obama ve svém projevu zmínil klišovitou informaci o tom, že NSA chrání občany před hackery, co jim chtějí vyluxovat jejich bankovní konta. Pokud tedy NSA chrání naše peníze před skupinou neznámých hackerů, nechme ji dělat cokoliv si zamane.

Na druhou stranu, pokud celý problém nezjednodušíme, je velice obtížné udělat si v celé situaci přehled. Mnohem jednodušší je se problému nevěnovat vůbec. A věnovat se třeba nebetyčnému platu poslanců a prezidentským sprosťárnám v rádiu. Společnost Snowdenovým odhalením dělají mezi problémy, který občan prostě neřeší, státní rozpočet na příští rok, estébácká minulost ministra financí i primátorky Prahy, a další. Jednodušší problémy je prostě vytlačili na vedlejší kolej.

Proč je vlastně diskuze okolo Snowdena a NSA tak složitá? Jen těžko po kritice zkratkovitosti složitost problému vystihnu v jedné větě. Můžu se jí pokusit alespoň nastínit. Otázka zní: Jak vlastně máme reagovat na zjištění o programech NSA? Je potřeba podniknout změnu zákona? A jako občan cizí země, jak můžu do takové věci zasáhnout? A jsou programy NSA legitimní? Jsou potřebné? A pomohly zajištění bezpečnosti? A jaké části svobody se vzdáme ve prospěch zajištění bezpečí? A jaké části bychom se měli vzdát? Co to je soukromí? Co to je soukromí v době internetu? A když někdo sleduje naše data, o jak velké narušení soukromí se jedná? Má cenu lpět na principu soukromí? Má ještě vůbec nějaký význam? Také je tu jedna důležitá otázka: Nedělám přeci nic špatného, musí mě věc zajímat?

A to jsou jenom základní otázky, které člověka při sledování kauzy napadnou. Kolik otázek vyvstane z toho, když na ně člověk začne hledat odpovědi! To ale není důvod, se otázkami nezabývat. Složitost problému nijak nepodkopává jeho důležitost. Bohužel ale složitost odrazuje mnohé od toho, se problémem zabývat.

Internet tu je příliš krátce

Internet je stále jeden nejmladších vynálezů, které významně ovlivnili tvář světa. Jeho dopad byl ale velice náhlý. Internetoví giganti jako Google či Facebook jsou zatím velmi mladí, abychom dokázali říct, jak budou vypadat za deset let. Pravidla chování na internetu, pravidla o jeho obsahu a jeho vlastním fungování ještě nejsou ustálená dlouholetým užíváním. Podoba internetu se mění stejně, jako podoba světa, kterou tolik ovlivnil. Kdo by například předpověděl, že většinu dat přenesených na internetu bude tvořit video?

Stejně tak ještě ve veřejnosti nepanuje shoda, jak se smí nakládat s obsahem na internetu. To, že během dne by televize neměla ohrožovat výchovu mládeže, je obecně přijímaný fakt. Ale že by člověk neměl mít stejné heslo na pochybném eshopu jako má v internetovém bankovnictví, ještě není ve společnosti dostatečně známo.

Možná i to, že nevíme, jak vlastně máme reagovat a jaké místo má ve světě internetu tato kauza, je důvodem naší vlažné reakce.

Nechce být hrdina

Fráze o tom, že Snowdena lidé nazývají zároveň zrádcem i hrdinou, otevírá mnoho článků i přednášek. Ano je to tak, mnoho lidí vidí Snowdena jako zrádce, jako člověka, kdo naučil teroristy lépe skrývat svou komunikaci. Druzí ho vidí jako odvážného člověka, který odhalil velice důmyslné projekty, které narušují naše soukromí na internetu.

Sám Snowden na sebe nechce strhávat pozornost. Nechce být hrdinou. Dál a dál vypouští do světa dokumenty a snaží se upoutat pozornost právě na ně. Jenže to je chyba. Lidé potřebují hrdinu, který se stává ztělesněním hodnot, za něž je třeba bojovat.

Například pohádky už ve svém názvu obsahují své hrdiny, na které se váže celý odkaz té pohádky. Hrdinové ve všemožných příbězích jsou nositeli hodnot, které si pak přisvojujeme. Právě toho by měl Snowden využít. Měli bychom o něm točit fantastické filmy, psát knihy, skládat epické básně. Ba co víc, měli bychom rozebírat co má Snowden na sobě, šťouchat ho teleobjektivy do oka a číst si o něm v Mladé Frontě, Metru i Blesku. Měli bychom s ním vařit podzimní recepty.

Jinak hrozí, že na něho zkrátka zapomeneme. On sám říká, že nám hrozí otupění z podobných odhalení o státních zásazích do našeho soukromí. Zároveň ale postupně uvolňuje další informace o projektech NSA. Postupně nás vaří jako žábu. Až se nakonec smíříme s naším osudem bez soukromí.

Soukromí na internetu

O co tedy máme usilovat na internetu? Zjednodušeně o to, o co bychom usilovali i ve “fyzickém”světě. Internet je jeho nadstavba, jeho rozšíření. Je to svět 2.0. Ale vychází právě ze světa 1.0. Emaily jsou elektronická pošta. Facebook wall je elektronická nástěnka. (Zlý překladatel nám z ní udělal zeď.)

Soukromí je právo na činnosti, při kterých vás nikdo jiný nesleduje a nebo neví, co děláte. Některé činnosti prostě chceme provádět úplně sami, aniž by nás někdo sledoval. Právo na soukromí stanovuje Listina základních práv a svobod. Ve fyzickém světě si lze docela dobře představit, že máme právo se okolnímu světu schovat a konat mimo dohled jiných lidí.

Jenže když se dostáváme na úroveň internetu, znamenal by podobný přístup vytáhnout z počítače kabel nebo vypnout wi-fi a pracovat offline. Ale i ve fyzickém světě považujeme za soukromé i naše chování na veřejnosti: Třeba když jdeme do knihovny. Jen někdo, kdo by nás soustavně sledoval po ulici, by věděl, co přesně děláme. Ostatní vidí pouze jednotlivosti. Jak jdeme po ulici tady, jak přecházíme nějakou další ulici. Jak bereme za kliku a vstupujeme do knihovny. Dané útržky informací samy o sobě nemají pro náhodné kolemjdoucí, ani náhodné známé příliš smysl. Takže ani nepovažujeme za narušení našeho soukromí, když nás někdo při vstupu do knihovny zahlédne. Při vstupu do Night Clubu se mnozí dvakrát rozhlédnou kolem, zde je nevidí někdo, kdo by mohl informaci zneužít. Z hlediska ochrany soukromí by ji ale zneužívat neměl.

Z principu fungování internetu i naše data putují po síti přes mnoho míst a kdyby se někdo pořádně pídil, mohl by je všechny posbírat. Přesto internet vnímáme spíše jako veřejné prostranství: Když někde přejdeme ulici, nikoho to nezajímá. Jenže využíváme služeb internetových obrů, kterým umožňujeme o nás sbírat po střípkách důležitá data o tom, co na internetu děláme. Aby toho nebylo málo, umožňují k těmto datům přístup tajným službám.

To by nebylo zas tak špatně, kdyby se tak dělo v mezích právního státu stojícícho na principech dělení moci. Zkrátka, když mám podezření, požádám soud, abych k těmto datům získal přístup. Jenže tento soud je obvykle tajný, aby se nezmařilo vyšetřování, takže o rozhodnutí se nikdo nikdy nedozví, i kdyby bylo špatné. Ten, koho se to týká, se nemůže odvolat, maximálně až u soudu se může obviněný člověk bránit, že byly důkazy obstarány nezákonně. A veřejnost se v takovém případě podivuje, proč by nemohl být usvědčující záznam z mobilního telefonu použit k usvědčení pachatele ošklivého zločinu. Právě proto, že opatření proti neoprávněným zásahům do soukromí má chránit ty, kdo se žádného zločinu nedopustili, a kdyby bylo použití neoprávněně získaného materiálu povoleno, ospravedlnilo by to sledování nevinných lidí.

Principy, které mají naše soukromí bránit před odposlechem ze strany policie nebo rozvědky, jsou navrženy v podstatě správně: Svolení k odposlechu dává soud a celkovou činnost v této oblasti dozorují zvláštní komise poslanců. Bohužel tento princip nefungoval správně třeba ve Spojených státech, když se ukázalo, že některé projekty byly vedeny nezákonně.

Rozpor mezi svobodou a bezpečím

Postupně se přibližujeme složitosti konfliktu mezi soukromím a bezpečností. Snowdenovo odhalení tajných materiálů odstartovalo fázi normování nakládání s osobními daty na internetu ze strany bezpečnostních služeb státu i soukromých společností. Právě teď nastala ta doba, kdy internet přestává být tak novým, aby pro něj neplatila žádná ustálená pravidla. Zároveň začíná být natolik rozšířeným, aby se pravidla internetu začala ustalovat.

V případě Snowdena a NSA jde především o rozpor mezi svobodou a bezpečností. Existují určitě i lepší příklady, kam by vše mohlo zajít, ale chytnu se populárního filmu Já, Robot, ve kterém se nakonec roboti v čele s gigantickou umělou inteligencí rozhodnou výrazně omezit naši svobodu, aby zajistili naše přežití. Problém nelze vnímat černobíle a vstupuje do něj mnoho faktorů. Je nutné vést diskuzi a hledat rovnováhu mezi zajištěním dostatečné bezpečnosti a zachování co největší míry svobody.

Osobně si myslím, že je třeba jít prošlapanou cestou, nesnažit se o revoluční řešení. Snažit se vylepšit stávající systém dělby moci. Vyjít z principů starých médií a aplikovat je na ta nová.

Debata je otevřená pro nás všechny a neměli bychom zůstat bokem. Internet je pro mnohé největším vynálezem posledních let, novodobý div světa. Proto by si zasloužil pozornost nás všech. Právě se rozhoduje o jeho budoucnosti.

Na závěr ještě podotknu, že s tímto tématem souvisí i další, kterým jsem se v textu vyhýbal. Je to například míra využití uživatelských dat k marketingu, která se týká našeho soukromí v obdobné míře. Nebo princip síťové neutrality. Témat týkajících se celosvětové sítě internet je mnoho, sledujme je.

Informační zdroje

Harman, J. Security or Libery? How the U.S. Can Have Both, New Republic, 13.09.13 [online]
- http://www.newrepublic.com/article/114764/security-or-liberty-how-us-can-have-both
Security v freedom in the United States: Liberty’s lost decade, The Economist, 03.08.13 [online]
- http://www.economist.com/news/leaders/21582525-war-terror-haunts-america-still-it-should-recover-some-its-most-cherished
Claude Moraes, Report on the US NSA surveillance programme, surveillance bodies in various Member States and their impact on EU citizens’ fundamental rights and on transatlantic cooperation in Justice and Home Affairs, Committee on Civil Liberties, Justice and Home Affairs, 21.02.14, [online]
- http://www.europarl.europa.eu/sides/getDoc.do?type=REPORT&reference=A7-2014-0139&language=EN
Transcript of President Obama’s Jan. 17 speech on NSA reforms, The Washington Post, 17.1.14, [online]
- http://www.washingtonpost.com/politics/full-text-of-president-obamas-jan-17-speech-on-nsa-reforms/2014/01/17/fa33590a-7f8c-11e3-9556-4a4bf7bcbd84_story.html
Čížek Jakub, Nové dokumenty odhalují, že NSA už před lety rozlouskla HTTPS, Živě, 29.12.14, [online]
- http://m.zive.cz/nove-dokumenty-odhaluji-ze-nsa-uz-pred-lety-rozlouskla-https/a-176623/?textart=1
Edward Snowden: Here's how we take back the Internet, TED talk, březen 2014
- http://www.ted.com/talks/edward_snowden_here_s_how_we_take_back_the_internet
Mikko Hypponen: How the NSA betrayed the world's trust — time to act, TED talk, říjen 2013
- http://www.ted.com/talks/mikko_hypponen_how_the_nsa_betrayed_the_world_s_trust_time_to_act
Richard Ledgett: The NSA responds to Edward Snowden’s TED Talk, TED talk, březen 2014
- http://www.ted.com/talks/richard_ledgett_the_nsa_responds_to_edward_snowden_s_ted_talk

pondělí 8. září 2014

Závěrečné myšlenky k datové žurnalistice

Uběhl semestr, ve kterém jsme si hráli na datové žurnalisty. Myslím, že většina věcí, které jsme si o ní řekli, patřila obecně do žurnalistiky. A zmáčknout tolik informací do jediného kurzu nelze. Nicméně nechápu, proč jsem si tu neodlišnost datové žurnalistiky uvědomil až teď. Hlavní rozdíl, který v datové žurnalistice spatřuji, je důraz na zpracování a vizualizaci "velkých" dat. Vlastně nevím, jak ta data mám nazvat. Ona totiž nejsou velká ve smyslu Big data. Ale nejspíš jsou strukturovaná a na jejich zpracování použiji specializovaný nástroj, matematiku a grafy. Toť asi můj pokus o popsání těch dat.

Moje snažení stát se datovým žurnalistou a napsat alespoň pidičlánek mi nadlouho uvízne v hlavě. Hlavně asi to, jak jsem se kvůli vlastní neschopnosti přiřadit tomu dostatečnou důležitost dostal do skluzu. A taky ta chvíle, když se vyučující Šlerka zeptal, co na těch datech shledávám zajímavé, a nepřišlo mi na nich asi nikdy nic moc zajímavé a jen jsem žasl, co na nich vidí ostatni.

Je jasné, že byť mám technicky k DŽ blízko, nemám pro ni nejspíš vlohy. Nejlepší by bylo, kdybych stál na straně jeji konzumace. Dovedu ocenit pěkné grafy a štve mně, když jiné používají špatné měřítko. Ale vymýšlet pěkné grafy je mnohem obtížnější, než jsem si myslel.

Na závěr mi z hodin uvízla ještě jedna důležitá otázka datové i nedatové žurnalistiky: "Co tím chcete říct?" Tu si ponesu jako standartu ma vrcholu mých znalostí, které si z kurzu odnáším.