NA SOCIÁLNÍCH SÍTÍCH MÁ KAŽDÝ SVŮJ SVĚT, ŘÍKÁ ŠÉF SEMANTIC VISIONS

Internet je zahlcen obsahem, který se zdá často bezcenný. Česká firma Semantic Visions ho ale umí prosívat tak, že i na druhém konci světa najde zmínku, která by potenciálně mohla ohrozit miliardový byznys globálních hráčů.

Foto: Libor Fojtík

Po kvalitních informacích touží každá firma. Stejně tak se každá společnost chce rychle dostat ke zprávám, které by ji mohly ohrozit. Ani armáda dobře placených pátračů na internetu, která bude ve dne v noci hledat potenciální hrozby, k tomu ale nestačí. Člověka v tom dávno nahradil stroj. Pokud pracuje s metodou sémantické analýzy a řídí ho šikovný algoritmus, který je na míru ušitý zákazníkovi, může včas zabránit miliardovým ztrátám. Česká firma Semantic Visions tuto službu umí a nabízí ji více než 300 klientům po celém světě. Systémy, které si odzkoušela v komerční sféře, teď navíc aplikuje i na dezinformační obsahy a chce pomáhat hlídat také sociální sítě. „Nepropagujeme cenzorství. Důležité je ale zastavit umělé zveličování zpráv, které poškozují společnost,“ říká František Vrabel, zakladatel a generální ředitel Semantic Visions.

Když jste začínal před 25 lety podnikat v IT, vrcholem práce s daty na internetu byly vyhledávače. Jak vás napadlo sestrojit „vyhledávač“ obsahu, jenž umí sám najít klíčové zprávy, aniž by bylo třeba konkrétní zadání?

Ono to bylo postupné. Naší první doménou byla bezpečnost v tehdy právě vznikajícím elektronickém obchodování a analýza rizik.  Začali jsme pracovat s „big data“, i když tehdy se tomu tak ještě neříkalo. Na přelomu tisíciletí, když splaskla internetová bublina, si nás všimla americká armáda a pracovali jsme na projektech americké zahraniční pomoci v souvislosti s rozšiřováním NATO do zemí bývalého východního bloku. Naším úkolem bylo zajištění interoperability počítačových systémů, ve vojenském žargonu C4I, což je zkratka z anglických slov pro velení, kontrolu, komunikaci, počítače a zpravodajskou službu.

Práce pro Američany skončila v roce 2006 a já byl přesvědčen, že bychom uměli vytvořit lepší systém sémantické analýzy internetového obsahu, než který tehdy na trhu byl. Všechny systémy měly tu slabinu, že byly postaveny na angličtině a spousta informací a trendů v ruštině nebo čínštině jim tak unikala. Bylo to dáno tím, že sběr informací probíhal hodně manuálně, a navíc hned v této fázi cizojazyčný obsah přeložili do angličtiny. Výsledkem bylo, že velká většina informací zůstala nepovšimnuta, což přirozeně negativně ovlivnilo výsledný analytický produkt.

Semantic Visions dnes pracuje s dvanácti jazyky. Je to tak, že na každý z nich zaměstnáváte rodilého mluvčího?

V principu ano, ve firmě je nás patnáct národností. Máme mezi sebou pár polyglotů, kteří zvládnou jazyků více, zejména těch západoevropských. Jiné je to u asijských jazyků, jako jsou čínština, japonština nebo korejština, protože tam jde kromě lingvistické stránky pokaždé také o jiný kulturní kontext.

Dá se říct, který jazyk se na práci s otevřenými daty hodí lépe, s kterým se pracuje snáze?

My pracujeme s morfologií jazyka a hlavně s kontexty, které jsou pro nás nejzajímavější. Slova mají různý význam, i když znějí stejně. Vezměte si české slovo problém, tím označujeme kdeco. To by anglický rodilý mluvčí neudělal, to slovo má mnohem závažnější význam. Možná překvapivě je práce s asijskými jazyky o něco snazší, protože znakový systém má unikátnější charakter než písmena v latince. Na druhou stranu je pak problém s přepisem evropských názvů do znakového písma a naopak. Každý jazyk tak má svoje plusy i mínusy.

Jak velký objem obsahu na internetu jste schopni monitorovat?

Náš odhad je, že pokrýváme 90 procent online zpravodajství. Patří tam zpravodajské portály, blogy, weby vládních, veřejných a výzkumných institucí, univerzity a také vybrané firmy. Takových zdrojů sledujeme skoro milion. Vše je dáno algoritmem, který jsme vytvořili a který se odvíjí od potřeb našich klientů.

Jedna z vašich nejrozšířenějších služeb je varování před potížemi v dodavatelských řetězcích. Ty hodně utrpěly právě v době protiepidemických opatření v souvislosti s koronavirem. Dokázali jste trhliny v dodavatelských sítích předem odhalit?

My dáváme echo o vznikajících trendech a rizikových událostech, interpretace našich upozornění je pak na klientech. Případy, kdy jsme někomu dobře poradili, samozřejmě existují, my máme ale přísné podmínky mlčenlivosti, a i kdybych chtěl, nikoho jmenovat nemohu. Obecně ale našich služeb využívá na 300 klientů po celém světě, a to včetně vlád. Drtivou většinu tvoří ale komerční sféra a logicky pak především ty obory, které mají složité dodavatelské řetězce. Typově tedy velké strojírenské firmy, výrobci letadel, automobilky, finančnictví. A co je zajímavé, také farmaceutické firmy, které mají často přes sto tisíc dodavatelů.

Neřestí mnoha firem je takzvaný greenwashing, kdy opatření ve prospěch životního prostředí dělají jen na oko. I takové chování umí nástroje Semantic Visions odhalit. Ilustrační foto: Shutterstock

Jak se dostáváte k novým klientům? Předpokládám, že třeba reklama pro vás smysl nemá…

Důležité jsou pro nás reference. A strategická partnerství. Naši zákazníci jsou globální hráči, kteří požadují komplexní řešení, které jim může nabídnout silný systémový integrátor nebo firma s opravdu širokým portfoliem služeb. Takové strategické partnerství máme se společností SAP.

Kromě sledování dodavatelských řetězců klientům nabízíte monitoring přírodních katastrof, ale třeba i sledování udržitelnosti a zodpovědného chování. Jak si to v praxi lze představit? To sledujete, jestli někdo opravdu sází stromy?

Počítáním vysazovaných stromků hříšníky bychom se daleko nedostali. I když jsou případy, kdy ty stromky nikdo nezalije, takže celá ekologická iniciativa přijde vniveč. Sledování zodpovědného chování k přírodě a lidem je trend, který někdy před pěti lety dorazil do Evropy z USA, což je náš hlavní trh. My jsme schopni rozlišit, zda firmy opravdu něco dělají ve prospěch životního prostředí a sociální sféry nebo to dělají jen na oko. Takový greenwashing se dá odhalit, umíme objektivizovat informace, které o sobě firmy publikují, nejčastěji ve formě výročních zpráv. Ty jsou zveřejňovány jen jednou za rok, se zpožděním, my jsme ale schopni časové období dotáhnout až do současnosti. Umíme také detekovat firmy, které jsou naopak proaktivní a iniciativní. To mají zodpovědní investoři rádi.

Abych dal konkrétní příklad: třeba automobilky se bojí toho, aby některý ze subdodavatelů nepodváděl v udávání emisí. Mají obavy, aby někdo z jejich dodavatelského řetězce v rámci rozvoje elektromobility nezneužíval dětskou práci při těžbě vzácných kovů. Nebo aby se uměl dostatečně distancovat od dětských sňatků. Může se nám to zdát podružné, protože to je sledování řádově desetitisícin v celém distribučním řetězci jedné globální firmy. Ale i tato nepatrná zmínka o neetickém přístupu tohoto nepatrného zlomku může vážně narušit miliardový byznys.

Obecně bych řekl, že celý segment zodpovědného chování k životnímu prostředí a sociální sféře, který se označuje jako ESG, bude narůstat. Řada investorů již dnes nevkládá peníze do firem, které takový profil nemají nebo jsou z tohoto pohledu nedůvěryhodné.

Kromě podnikání se věnujete sportu. Patříte mezi průkopníky skialpinismu v Česku, máte za sebou řadu prvosjezdů. Existují nějaké oblasti, kde to nikdo se sémantickou analýzou nezkusil, a mají přitom velký potenciál? Takové prvosjezdy v práci s otevřenými daty?

Napadají mě dvě oblasti. Jedna z nich je propojení rizik spojených s firmami a geografickým prostředím, kde působí. A za druhé by se dalo mnohem víc pracovat se sentimentem. Na základě přesného sledování skoro milionů zdrojů máme hluboký vhled do toho, jak se odvíjí sentiment jednotlivých průmyslových odvětví té které země nebo oblasti. Tato data jsme schopni navzájem kombinovat. Do velké míry bychom uměli předpovídat vývoj na trzích v různých odvětvích a regionech. O výhodách této služby jsme ale zatím nikoho nepřesvědčili, klientům se to zdá jako sci-fi.

V poslední době jste se začali zabývat také bojem s dezinformacemi. Vidíte v tom nějakou obchodní příležitost, nebo jste přesvědčen, že když už umíte sémantickou analýzu, je třeba dělat i věci, které jsou správné?

Obojí. Když v roce 2014 začala ruská invaze na Krym, zajímalo nás, jestli bychom ji na základě našich analytických nástrojů byli schopni předpovědět. A vyšlo nám, že ano. Dlouho jsme si pak lámali hlavu, jak pokud možno v reálném čase detekovat škodlivý obsah. Došli jsme k závěru, že ta hlavní strategie EU, tedy boj s dezinformacemi pomocí ověřování faktů, uvádění na pravou míru, je slepá ulička. Počítač vám dokáže zkontrolovat pouze zjevná data a fakta. Když napíšete, že žádný holokaust nebyl, algoritmus si vás najde. Ale ověřovat v reálném čase, zda se něco událo tak, jak se to líčí, algoritmicky vyřešit nejde.

Nicméně cestu jsme našli, a to prostřednictvím detekování takzvaných dezinformačních narativů. Jsou to ustálená líčení, která se v článcích a příspěvcích na internetu opakují. Typické je, že se prolíná vícero příběhů najednou. Vzali jsme tedy naše nástroje pro komerční sféru a použili je na dezinformační obsahy. A jsme v tom opravdu přesní, pracujeme v řádu vteřin, což má pro boj s dezinformacemi velký smysl.

Kde je v boji s dezinformacemi pro vás komerční příležitost?

Komerčně jsme schopni pomáhat zpravodajským portálům odhalovat v diskuzích dezinformační obsah. Našimi klienty by se mohly stát velké mediální domy, vyhledavače a samozřejmě sociální sítě. 

Neusilujeme o to, aby tyto obsahy byly smazány, jde nám o indikaci, aby se takovým informacím a názorům nedával větší prostor, než by si zasloužily. Protože algoritmy, které mohou konkrétní obsah na webu posunout dál, amplifikovat, jsou nastavené tak, aby reagovaly na emoce, strach, úzkost. A dezinformace jsou mimo jiné založeny na tom, že s takovým zveličením počítají.

Má podle vás smysl v reakci na proud dezinformací „odstřihávat“ vybrané weby od internetu, jak to nedávno udělal správce národní domény, společnost CZ.NIC?

Z mého pohledu je dobře, že se tak v souvislosti s ruskou vojenskou agresí stalo. Ale určitě to není dlouhodobé řešení. Ty weby pracují dál, jen pod jinou doménou. Jestliže bezprostředně po odstavení z národní domény klesla jejich návštěvnost na polovinu, teď se postupně vrací. Navíc se obsah z webových portálů přelévá na sociální sítě. Nejen do těch „západních“, ale nejnověji i do ruské sítě Telegram, o které Kreml tvrdí, že s Ruskem nemá nic společného. Málokdo tomu ale věří.

Znamená to, že by i obsah sociálních sítí měl být regulován?

To se stát musí. Evropská unie proto připravuje Digital Services Act, soubor legislativy o digitálních službách, který by měl být schválen ještě letos. Bohužel je ta předloha silně prolobbována a nejde po jádru problému. Točí se v tom miliardy dolarů, takže se obávám, že výsledek bude bezzubý. Nicméně ten hlavní problém zůstává: sociální sítě se staly dominantními médii, nespadají ale pod žádný mediální zákon, nejsou regulovány.

Přitom škody, které mohou společensky napáchat, jsou obrovské. Díky silné personalizaci obsahu, což je jejich obchodní model, předkládají každému z nás různou verzi světa. Lidé si přestávají rozumět, sociální sítě tlačí obsah, který radikalizuje společnost. Dokud si tohle legislativci neuvědomují, tak ten problém bude jen eskalovat. Nejjednodušším a nejčistším řešením by bylo, aby se provozovatelé sociálních sítí stali zodpovědnými za obsah, který publikují.

Nepovede to ale k tomu, že se regulace sociálních sítí označí za politickou cenzuru? Že na sítích vzniknou disidenti?

Přenesení zodpovědnosti za obsah ale nemá nic společného s ohrožením svobody slova, jak se kritici snaží argumentovat. Nikdo tady nevolá po tom, aby se vybrané obsahy smazaly – to by koneckonců v USA zřejmě neprošlo kvůli porušení prvního dodatku ústavy. My nepropagujeme cenzorství. Důležité je zastavit umělé zveličování nepravdivých zpráv. Ať si každý píše, co chce. Lži a pomluvy tu byly vždy. Ale ať pak nečeká, že jeho názory někdo bude cíleně dál šířit.  

BLAHOSLAV HRUŠKA

 

Díky našim firmám o nás ví celý svět