Analýza Twitteru poukazuje na rozsah informační války na ruském internetu

Profilové fotografie široké sítě prokremelsky naladěných uživatelů Twitteru. Obrázek vytvořil autor článku.

Profilové fotografie široké sítě prokremelsky naladěných účtů na Twitteru. Obrázek vytvořil autor článku.

Za pomoci volně dostupných programů shromáždil výzkumník v oblasti internetu Lawrence Alexander data téměř 20 500 prokremelských účtu na Twitteru a vizualizoval je. Odkryl tak široký rozsah pokusů o manipulaci informací na ruském internetu. V první části dvoudílného článku vysvětluje, jak tuto analýzu provedl a co zjistil.

Služba RuNet Echo již dříve psala o snaze ruské „armády trollů“ zanést na sociální sítě a stránky online médií prokremelskou rétoriku. Twitter není žádnou výjimkou a mnoho uživatelů si všimlo, že různé účty na Twitteru píší podobné texty v reakci na důležité zprávy a události. Se začátkem konfliktu na Ukrajině se tito „boti“ stali aktivnějšími. Jejich účty přitom vyvolávají dojem běžných uživatelů Twitteru, i s fotografiemi.

Nicméně indicie shromážděné v této dvoudílné analýze poukazují na jejich roli v rozsáhlém dezinformačním programu.

Novinář z USA Alec Luhn, který píše o dění v Rusku, si povšiml, jak se 27. února – jen pár hodin po zastřelení Borise Němcova – několik účtů na Twitteru snažilo ovlivnit způsob, jakým veřejnost vnímá tuto událost:

Boti rozšiřují historky o Němcovově smrti typu „Zabili ho Ukrajinci… přebral jednomu z nich přítelkyni.“

Za použití nástroje s otevřeným zdrojovým kódem NodeXL jsem sestavil kompletní seznam účtů, které na Twitteru napsaly tuto větu, a importoval ho do tabulky. Z tohoto seznamu jsem také vzal a importoval nejbližší okolí těchto uživatelů, tedy ty, kteří tyto účty sledují. Měl to být zajímavý test – pokud je Němcovovo očerňování jen malá epizoda v šíření fám, nemělo by jít o více než pár desítek účtů.

Když ovšem software dokončil svou analýzu, odkryl rozsah této sítě: ohromujících 2 900 účtů. Toto číslo je do určité míry pochopitelné. Aby byly falešné účty na Twitteru důvěryhodné, musí tu být dostatek lidí, kteří je sledují. A to vyžaduje další podpůrné účty.

Poté jsem použil další volně dostupný analytický nástroj Gephi k vizualizaci dat v takzvaném grafu „entity-relationship“. Barevná kolečka – uzly grafu – představují účty na Twitteru, spojující čáry – hrany – ukazují, že jednotlivé účty navzájem sledují své zprávy. Účty jsou značeny několika různými barvami podle algoritmu, který vyhodnocuje úzce propojené skupiny. Velikost každého uzlu je dána počtem spojení, který má daný účet s ostatními v této síti.

Síť 2 900 botů na Twitteru pocházející ze vzorku tweetů o Borisu Němcovovi. Obrázek vytvořil autor článku.

Síť 2 900 botů na Twitteru pocházející ze vzorku tweetů o Borisu Němcovovi. Obrázek vytvořil autor článku.

Podle toho, jak je tato síť hustá a jak blízko si jsou jednotlivé uzly, je zřejmé, že jde o rozsáhlou a vysoce propojenou síť. Většina botů sleduje zprávy mnoha ostatních a umocňují tak navzájem svůj status. Na okrajích je několik kruhů méně propojených účtů, které mohou naznačovat, že síť „botů“ v době pořízení těchto dat stále ještě rostla. Můžete si ji představit jak strom, jehož větve se roztahují do prostoru.

K této analýze se ovšem nabízí jedna zásadní otázka: Jak si můžeme být jistí, že se v této síti nacházejí převážně automatičtí boti, nikoli reální lidé?

NodeXL nesbírá jen informace o tom, kdo koho sleduje. Pořizuje také metadata – veřejně dostupné detaily o každém účtu na Twitteru a o jeho chování. Tyto informace ukázaly, že ze sítě 2 900 účtů nemělo 87 % profilů vyplněnou informaci o časové zóně, 92 % žádné oblíbené tweety. Ovšem v náhodném vzorku 11 282 obyčejných uživatelů Twitteru (vytvořeném z účtů, v jejichž zprávách bylo použito slovo „and“) nemělo jen 51 % žádnou časovou zónu a pouhých 15 % žádné oblíbené tweety (oba tyto rysy by mohly být označeny za „lidské“ chování).

Pro porovnání je níže ukázán graf sestrojený na základě tohoto náhodného vzorku uživatelů Twitteru. Na rozdíl od sítě botů má tento graf několik na sebe nenapojených a izolovaných shluků – skupin uživatelů Twitteru, které navzájem nesledují své zprávy. Jde o zcela přirozený jev v případě výběru náhodné skupiny uživatelů.

Analýza využívání slova „and“ zobrazuje nenapojené, izolované shluky náhodných skupin uživatelů Twitteru. Obrázek vytvořil autor článku.

Po odkrytí tak velké sítě pomocí jediného zdroje jsem se rozhodl ve svém lovu botů pokračovat. Při hledání frází typu „kremelští boti“ (hashtag #Kremlinbots nebo #Кремлеботы), „proruští trollové“ nebo „Putinovy loutky“ jsem našel několik uživatelů, kteří ve svých tweetech upozorňovali na domnělé aktivity botů.

Použil jsem stejnou metodu jako v případě tweetů týkajících se Němcova a analyzoval jsem sítě účtů vybrané na základě používání některých klíčových frází, na které upozorňovala širší komunita. Někdy jsem ovšem vzal přímo jen seznam „podezřelých“ uživatelů, který někdo sdílel. Rozdělil jsem se tyto skupiny do vzorků A, B, C a D (o důvodech tohoto značení se zmíním v druhé části analýzy).

Satirický účet @PressRuissa (nyní pozastaven) paroduje proruská média, jde o směs satiry a komentářů k dezinformacím nebo předpojatosti. Jeden z jeho tweetů posloužil jako základ pro skupinu A:

Ruští uživatelé Twitteru odhalují, že „Novaja gazeta tutlá aktivity svých botů“, překvapivě unisono. (od uživatele @nokato)

Skupina B zahrnovala jiné podezřelé účty, jejichž chování se blížilo předešlým vzorkům. Některé bylo možné identifikovat podle jejich tendence přejít z ruštiny do angličtiny s chybovou hláškou „RSS in offline mode“. Ta byla nejspíše způsobena chybou v softwaru, který je ovládal.

Pro skupinu C byl použit tweet Devina Acklese, analytika think tanku CASE Ukraine.

Proruští boti v ofenzívě po útoku na Mariupol.

A nakonec Vitalij Moroz z organizace Internews Ukraine sdílel snímek obrazovky, který posloužil pro vznik skupiny D.

Ruští boti rozšiřují poselství války: „Myslím, že začne velká válka.“

Ze všech čtyř skupin byla vytvořena jediná sada dat, která dohromady čítá 17 590 účtů na Twitteru. Stejně jako v případě tweetů týkajících se Němcova se potvrdilo, že většinu těchto účtů opravdu tvořili boti. 93 % nemělo v profilu vyplněnou zeměpisnou polohu, 96 % časovou zónu a 97 % nemělo žádné oblíbené tweety.

Také navzdory průměrné produkci 2 830 tweetů nevstupovaly tyto účty téměř nikdy do kontaktu s ostatními uživateli, ať už přímým zmíněním nebo odpovědí na jejich tweety.

 Reply and Mention Network

Boti píšou tweety, ale neinteragují – většina uzlů vykazuje smyčky, což ukazuje na absenci interakce s ostatními uživateli zmíněním nebo odpovědí na jejich tweety. Obrázek vytvořil autor článku.

Je zajímavé, že většině botů byla dána „západně“ znějící jména jako třeba barnardgrant, terancebarnaby, terencecoward a duncanstarks.

Ale ještě překvapivější výsledek jsem získal, když jsem zobrazil tyto skupiny botů podle jejich vztahů. Ačkoli byly vzorky vybrány z různých zdrojů, byla výsledná síť silně propojena.

Network of Combined Bot Groups

Všech 17 590 účtů ze čtyř vzorků. Povšimněte si silného propojení a nepřítomnosti izolovaných ostrůvků. Obrázek vytvořil autor článku.

Tyto výsledky ostře kontrastují s náhodným vzorkem, který byl použit jako kontrolní skupina – v obrázku výše nevidíme žádné izolované skupiny nebo jedince. To přesvědčivě potvrzuje domněnku, že tito boti byli vytvořeni jediným úřadem. A zdá se, že vše ukazuje na Moskvu.

Ve svém příštím článku se podívám na časovou posloupnost zakládání účtů těchto botů a na korelaci s politickými událostmi v Rusku a na Ukrajině.

1 komenář

Zapojit se do konverzace

Autoři, prosím přihlásit se »

Pravidla

  • Všechny komentáře jsou schvalovány moderátorem. Pokud pošlete komentář více než jednou, může být vyhodnocen jako spam.
  • Respektujte prosím názory ostatních. Komentáře obsahující vulgarity, obscénosti a osobní útoky nebudou uveřejňovány.