Tags

Related Posts

Share This

EbolaTracking: come il virus Ebola viene visto su Twitter

Fondazione ISI di Torino presenta una nuova mappa interattiva che traccia, filtra e geolocalizza in tempo reale le menzioni del virus su Twitter. Uno strumento semplice e potente che, tramite l’uso di open data e servizi aperti al pubblico, riduce il rumore della conversazione online su Ebola e ne mostra in tempo reale i pattern più significativi.

I primi casi di contagio negli Stati Uniti e in Spagna hanno portato il virus Ebola all’attenzione globale. Localizzata per diversi mesi in Africa Occidentale, spesso confinata nelle sezioni “esteri” dei giornali e relativamente marginale nella conversazione online, nelle scorse settimane l’epidemia è improvvisamente diventata trending topic nell’arena della comunicazione mondiale.

Il Data Science Laboratory della Fondazione ISI di Torino e il MoBS Laboratory della Notheastern University di Boston hanno realizzato EbolaTracking, uno strumento interattivo che raccoglie le menzioni di Ebola su Twitter, ne analizza i riferimenti geografici e in base a quelli mostra ai visitatori una mappa interattiva del pianeta, aggiornata in tempo reale e “colorata” in base alla frequenza delle menzioni di città e paesi.

Ormai tutti parlano di Ebola su Twitter e il termine viene spesso usato anche in messaggi di spam”, spiega Ciro Cattuto, direttore scientifico di Fondazione ISI e coordinatore del Data Science Laboratory. “Dopo aver scaricato i dati dal social network, EbolaTracking li passa quindi sotto la lente d’ingrandimento di un sistema di machine learning, che abbiamo addestrato a distinguere – in base a diversi attributi – i tweet informativi da quelli che possono invece essere scartati”.

Nel corpus di tweet rilevanti dal punto di vista informativo, EbolaTracking verifica le eventuali menzioni geografiche presenti: luoghi, città e paesi vengono riconosciuti e localizzati attraverso il database del servizio GeoNames. Queste informazioni generano la mappa disponibile su www.ebolatracking.org, che visualizza l’intensità delle menzioni. I cerchi gialli indicano i centri urbani: più grande è il cerchio, più alto è il numero di citazioni. Anche il colore dei paesi varia a seconda delle citazioni: dal rosso (maggiore intensità) al bianco (minore intensità).

Il nostro obiettivo è ridurre la complessità e il rumore delle informazioni che oggi circolano attorno al virus Ebola”, spiega Cattuto. “EbolaTracking è uno strumento che mostra in modo diretto e accessibile gli eventi su Twitter, cioè quei gruppi di tweet che – in un lasso di tempo circoscritto – fanno riferimento allo stesso luogo”.

I dati di EbolaTracking vengono raccolti in tempo reale e la mappa visibile al pubblico viene aggiornata ogni 15 minuti. Scegliendo l’opzione last hour (in alto a sinistra della mappa) si visualizza l’intensità dei tweet nell’ultima ora; last day passa invece alla visualizzazione delle ultime ventiquattro ore. La mappa è interattiva: cliccando sui luoghi, vengono mostrati i tweet più recenti in cui è stata menzionata la relativa città o area geografica (i retweet non appaiono, ma vengono conteggiati nella verifica dell’intensità).

EbolaTracking è un sistema che utilizza i dati pubblici della API di Twitter (dev.twitter.com/streaming/overview), il database aperto di GeoNames (www.geonames.org/) e le mappe collaborative OpenStreetMap (www.openstreetmap.org). Una funzione supplementare che permetterà di suddividere i tweet anche in base all’argomento di riferimento (vaccini, casi, misure di controllo sanitario) è in fase di implementazione.

Il progetto è stato ideato e sviluppato dal Data Science Laboratory di Fondazione ISI (Marco Quaggiotto, André Panisson, Matteo Delfino, Ciro Cattuto) e dal MoBS Laboratory della Northeastern University di Boston (Nicola Perra, Qian Zhang e Alessandro Vespignani).