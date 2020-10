Internetové vyhľadávače spracovávajú miliardy požiadavok denne. "Odpovedajú" na naše otázky bez toho, aby sme museli kliknúť na ďalšiu stránku.

Uchovávajú záznamy o našich priateľoch, tých skutočných aj virtuálnych. Vyhľadávajú nám zábavu. Zostavujú pre nás rebríčky čohokoľvek od filmov, cez hotely, cestovky, až po lekárov. Môžu byť všeobecné alebo špecializované, či sociálne. Existujú obrovské aj miniatúrne, verejné aj zašifrované.

Vďaka ich schopnosti a našej ľahostajnosti často určujú čo sa dostane zo zorného poľa našej pozornosti. Vedú nás, často významným spôsobom ovplyvňujú naše rozhodnutia o tom čo si myslíme, čo robíme, čo kúpime a čo nie.

Vyhľadávanie dáva každému kto vlastní počítač, alebo má prístup do knižnice, prístup k zdrojom informácií aký bol kedysi vyhradený iba ľuďom s neobmedzenými zdrojmi a dostatkom času. Ako všetko iné v digitálnej dobe má aj vyhľadávanie svoju temnú stranu a tá sa týka dôvery. Ako sa platforma rozhodne o tom, čo nám prezentuje ako odpoveď na našu vyhľadávaciu úlohu? Ako zoradí odpovede? Boli zoradené podľa ich štatistického výskytu v základných zdrojoch informácií (novinách, časopisoch, archívoch a podobne), alebo ich pre nás osobne vybral algoritmus? Ak to bolo na základe štatistík tak akých - počat citácií, dôveryhodnosť zdroja, či autora alebo niečoho úplne iného?

Vo všeobecnosti, ak traja rôzni ľudia zadajú do toho istého vyhľadávača rovnaký pojem, dostanú iné výsledky v závislosti podľa miesta kde sú, podľa ich histórie vyhľadávania, podľa záujmov, podľa všetkého toho, čo o nich vyhľadávacia platforma vie. Ak si tí istí ľudia kúpia klasické noviny vieme, že sa pozerajú na tie isté veci a ak sa niečo v nich nezdá v poriadku, existuje šéfredaktor, ktorému je možné adresovať sťažnosť. Rozhodnutia v centrále Google, či iných vyhľadávacích firiem, sa prijímajú za zavretými dvermi, vnútri "čiernych skriniek". Do akej miery môžeme dôverovať ľuďom, ktorí ich prijímajú?

Možnosť zahŕňať či vylučovať a zoraďovať je možnosťou zabezpečiť ktoré informácie, či dojmy ostanú v očiach verejnosti trvalé a ktoré v lepšom prípade hmlisté. Takto je možné do značnej miery ovplyvňovať kultúrne, ekonomické a politické spektrum spoločnosti.

Dominancia týchto vyhľadávacích firiem je tak kompletná a ich technológia taká zložitá, že doteraz unikajú akémukoľvek tlaku na ich transparentnosť a zodpovednosť, aké sa udržiavali u klasických médií voči verejnosti.

Začiatky firmy Google som spomínal na inom mieste (https://antonkovalcik.blog.sme.sk/c/541466/na-co-su-nam-algoritmy.html), preto ich tu vynechám.

Zakladatelia Google Brin a Page videli, že na Web pribúda každý deň obrovské množstvo obsahu - články, fotografie, hudba - preto sa snažili vyvinúť spôsob ako sa cez to všetko rýchlo usporiadane prehrabať. Chápali, že genialita vynálezcu Webu Tima Barnersa-Lee spočívala v schopnosti vidieť, že všetky veci existujúce v kyberpriestore sú navzájom pospájané. Web bol preňho niečo ako ústredná knižnica, kde každá kniha mala svoje číslo. Ibaže tu to bolo lepšie, pretože väčšina dokumentov bola navzájom pospájaná prostredníctvom "hyperlinkov", čo poskytovalo obrovskú sieť vzájomných prepojení, akú fyzické knižnice nikdy nemôžu dosiahnuť. Ako sa dá tieto miliardy prepojení usporiadať tak, aby to ľuďom umožnilo nájsť presne to spojenie, ktoré potrebujú? To bola otázka ktorú si Brin s Pageom položili hneď na začiatku.

Povedzme, že hľadáte informácie o nejakej konkrétnej osobe. Prístup AltaVista, vtedy vedúceho vyhľadávača bol založený na predpoklade, že dokument ktorý chcete je ten, ktorý sa o hľadanej osobe zmieňuje najviac. Page a Brin s tým nesúhlasili. Fakt, že v danom dokumente sa hľadané slovo nachádza najviac ešte nemusí znamenať, že na danú tému poskytuje najlepšiu informáciu. Ak nie tento prístup, tak potom aký je lepší? Lary Page tu využil skúsenosti svojich rodičov z vedeckej praxe. Najvyhľadávanejšími dokumentmi tu nie sú tie, kde sa najčastejšie opakuje nejaký termín, či meno, ale tie, ktoré sú najviac citované v iných vedeckých prácach. Ekvivalentom toho na Webe sú hyperlinky, čo znamenalo, že budú musieť nájsť spôsob, ako ich ich vyhľadávač dokáže všetky spočítať.

Tak Page a Brin vyvinuli program, nazvaný BackRub, ktorý sledoval linky späť k iným dokumentom. Program v zásade vypustil milióny miniatúrnych elektronických poslov, botov, aby sa prehrabali cez také množstvo dokumentov, aké je len možné a každý označili kódom, ktorý dokáže rozlíšiť len BackRub a potom spočítať všetky jeho spätné linky. Výsledkový súhrn nazvali PageRank.

Keďže hneď po spustení programu zabrali celú počítačovú kapacitu ich univerzitného oddelenia, obsadili celý systém Stanford Univerzity a tak ich boti mohli bez následkov brázdiť cez celý kyberpriestor, označovať, sumarizovať - potenciálne porušovať autorské práva čohokoľvek a kohokoľvek kto vytvoril nejaký obsah, ku ktorému sa v procese pripájali. Page a Brin na tom nevideli nič zlé. Jednoducho sa iba snažili dostať k vedomostiam zastrčeným v počítačoch po celej krajine aby poskytli užitok celému ľudstvu. Ak z toho budú mať úžitok aj oni dvaja, tým lepšie. Bol to prvý príklad toho, čo sa neskôr dalo klasifikovať ako krádež podľa zákona. (Masovo to využívali keď neskôr kúpili YouTube). Ak sa niekto sťažoval, Page vyjadril prekvapenie. Prečo by niekomu vadila ich činnosť, ktorá je tak viditeľne neškodná? Nepovažovali za nutné žiadať povolenie; jednoducho to urobili.

Tento prístup sa pre nich v ďalšom procese stal bežným. Keď Google vydal prvú verziu Gmail, Page nedovolil zahrnúť do neho tlašidlo "Delete", lebo schopnosť Google profilovať ľudí tým, že zachová ich korešpondenciu bola dôležitejšia, než ich možnosť odstrániť trápne, či zahanbujúce časti svojej minulosti. Podobne sa ľudí nikdy nepýtali či kamery Google Street View smú nasnímať priečelia ich domov a záhrad a spojiť ich s adresami, aby potom mohli predať viac reklamy.

Google sa vždy pridržiaval iba jednej zásady: "Je lepšie požiadať o prepáčenie, než prosiť o dovolenie." Aj keď v skutočnosti nikdy nerobili jedno, ani druhé.

Mám taký zvláštny pocit, akoby si ma niekto vygúglil

