Coronavirus, da Fbk l’analisi degli hashtag scelti dai trentini 

Scienza e società. I ricercatori hanno analizzato milioni di tweet geolocalizzati I dati sono stati resi anonimi e aggregati a livello di regioni italiane facendo un confronto col 201 La rappresentazione grafica attraverso tag cloud riflette le preoccupazioni di questi mesi  


Marzio Terrani


Trento. Di cosa hanno si è discusso in Italia su Twitter durante la prima fase della pandemia Covid-19? ricercatori della Fondazione Bruno Kessler di Trento hanno analizzato milioni di tweet geolocalizzati, ovvero quei tweet in cui l’utente ha volontariamente deciso di condividere la propria posizione, postati tra il 15 febbraio e 12 maggio 2020, e hanno misurato sia la frequenza degli hashtag sia i concetti presenti nei messaggi. Per fare un confronto, la stessa analisi è stata poi effettuata sui tweet geolocalizzati postati nello stesso periodo del 2019. I risultati sono stati quindi suddivisi per regione e rappresentati graficamente tramite delle tag cloud in modo da evidenziare le principali parole chiave.I dati sono stati anonimizzati e aggregati a livello regionale, garantendo il rispetto delle norme vigenti in materia di privacy.

Le rappresentazioni grafiche dello studio diviso per regioni o province - e quindi anche il Trentino e l’Alto Adige, presi singolarmente - sono visibili su questo link https://comunelab.fbk.eu/covid19_italy.php

«L’attività di ricerca necessaria per questa analisi - spiega Manlio De Domenico, fisico dei sistemi complessi e responsabile dell’Unità CoMuNe Lab alla FBK - si propone di capire meglio i comportamenti collettivi che possono essere misurati sui social media, come Twitter. Lo scopo è quello di avere una lente sul territorio basata sui big data, che permetta di capire meglio le problematiche dei cittadini e la loro risposta alle scelte dei decisori politici. È in questo contesto che CoMuNe Lab, afferente alla linea di ricerca Digital Society, raccoglie dati su tutto il territorio italiano dagli inizi del 2019. I messaggi pubblici considerati sono quelli che contengono informazione di geolocalizzazione autorizzata dall’utente e vengono successivamente anonimizzati ed aggregati a livello di regione o provincia, per garantire il rispetto della privacy individuale. I dati considerati sono quelli relativi all’intera discussione pubblica, quindi non soltanto legata alla recente evoluzione della pandemia di Covid-19».

Lo studio riporta il risultato di due analisi distinte: da un lato la frequenza degli hashtag utilizzati, espressione della volontà individuale di collocare il proprio tweet nell’ambito dell’attenzione collettiva su un determinato argomento; dall’altro, la frequenza dei concetti utilizzati per esprimere il proprio pensiero. Nella seconda analisi, sono state utilizzate tecniche di machine learning learning per automatizzare il processo e analizzare le centinaia di migliaia di tweet postati tra febbraio e maggio, rispettivamente nel 2019 e nel 2020.

Un approccio quindi decisamente interessante e, per certi versi anche innovativo per quanto riguarda l’analisi di quella che una tempo si chiamava sociologia delle masse, ma anche per capire qualcosa delle reazioni individuali, anche perchè ci sono differenze molto significative tra una regione e l’altra, anche tra aree geografiche contigue. Discorso che vale anche per il semplice confronto tra Trentino e Alto Adige.













Scuola & Ricerca

In primo piano