Propaganda, linguaggio e matematica

Share on facebook
Share on twitter
Share on linkedin

L’incendio del Reichstag nel 1933 e le armi di distruzione di massa di Saddam Hussein sono solo due dei tanti esempi di propaganda e disinformazione usati da dittatori e governi per ottenere il consenso necessario a raggiungere i propri fini. Qualcosa di simile sta avvenendo da anni anche nella regione ucraina del Donbass.
A indagare la questione è stato Jon Roozenbeek, ricercatore dell’università di Cambridge, che ha analizzato oltre quattro anni di contenuti multimediali. La sua ricerca è partita dal 2014, cioè da quando nelle cosiddette “repubbliche popolari” di Donetsk e Luhansk i media sono finiti in mano agli insorti sostenuti dalla Russia che li hanno usati per diffondere tra la popolazione una nuova identità filorussa, cancellare quella ucraina e favorire
il processo di separazione. Tuttavia, come sottolinea Roozenbeek, “otto anni di propaganda russa non sono riusciti a fornire un’alternativa convincente alla nazionalità ucraina in quell’area”.
Per esempio, il tentativo di resuscitare il nome usato per indicare il Donbass, definito da Putin Novorossiya o Nuova Russia come durante il regno di Caterina la Grande, è stato un fallimento. Lo studio rivela che, mentre la propaganda era tesa a demonizzare il governo ucraino come nuova incarnazione del nazismo, il termine Novorossiya era a stento menzionato e la disinformazione russa aveva mancato l’obiettivo di produrre una divisione veramente duratura tra la popolazione, alimentando la narrativa del “noi” (russi) contrapposta a “loro” (ucraini).

Analisi (matematica) di una propaganda

Per svolgere la sua ricerca, Roozenbeek ha usato i metodi del Natural Language Processing (Nlp), una branca dell’Intelligenza artificiale che combina la linguistica computazionale e la modellizzazione basata sulle regole del linguaggio umano con modelli statistici di apprendimento automatico e profondo. Nell’insieme, questi metodi consentono ai computer di “capire” il significato di un testo e perfino l’intento o il sentimento dell’autore. L’analisi dei contenuti prima del 2000 veniva fatta a mano dai ricercatori, poi sono arrivati i computer che hanno portato due grandi vantaggi: la velocità e la possibilità di eliminare o ridurre i bias inevitabilmente introdotti dagli stessi ricercatori. Con la modellizzazione, un algoritmo trasforma un testo in una serie di vettori (o un insieme di coordinate) in cui ad ogni parola viene assegnato un corrispondente unico in una matrice vettoriale multidimensionale.
Nel suo lavoro, Roozenbeek ha usato algoritmi basati su metodi matematici quali Latent Dirichlet Allocation, Latent Semantic Analysis e Non-Negative Matrix Factorization per determinare la prossimità semantica delle parole nei testi. Per questo ha passato al setaccio documenti legali, conferenze stampa, dichiarazioni ufficiali, e-mail, interviste e oltre 85.000 articoli (cartacei e online) di 30 media locali e regionali di Donetsk e Luhansk, ricavando dall’uso di parole chiave e frasi i modelli ricorrenti di contenuto, introdotti dopo la prima invasione russa del Donbass nel 2014.
I risultati svelano una strategia finalizzata a costruire e promuovere l’ideologia di una “sovranità culturale” russa nel Donbass che potesse fungere da trampolino per la creazione di uno Stato autonomo.
Invece, rivela Roozenbeek, “la propaganda per la costruzione dell’identità che ho trovato nel Donbass dopo il 2014 è stata vaga, mal concepita e rapidamente dimenticata. I tentativi politici di invocare la Novorossiya sono stati messi da parte già nell’estate del 2015. Putin ha gravemente sottovalutato la forza dell’identità nazionale ucraina anche nel Donbass e ha invece sopravvalutato il potere della sua macchina propagandistica”.
Lo studio si è concluso prima dell’invasione dell’Ucraina. Alla luce di quanto è successo in questi mesi, si è rivelato quanto mai lungimirante.