
Ruanda, estate 2009: i cellulari suonavano ovunque. Oltre a milioni di telefonate da familiari, amici e colleghi di lavoro,
circa mille ruandesi ricevettero una chiamata da Joshua Blumenstock e dai suoi collaboratori, che stavano studiando ricchezza
e povertà con una survey su un campione casuale di un milione e mezzo di clienti della compagnia di telefonia mobile più diffusa
in Ruanda. Blumenstock e il suo gruppo chiedevano agli individui scelti casualmente se volevano partecipare alla survey, spiegavano
in cosa consisteva e poi ponevano una serie di domande sulle caratteristiche demografiche, sociali ed economiche degli intervistati.
Fin qui, sembrerebbe una ricerca sociologica normale, tradizionale, ma c'era qualcosa di più, a cui non eravamo ancora abituati.
Infatti, oltre ai dati raccolti con la survey, il gruppo di Blumenstock aveva tutti i tabulati delle telefonate di questi
clienti: incrociando i dati, i ricercatori hanno usato i risultati dell'indagine per addestrare un modello di machine learning
a predire la ricchezza di una persona in base alle sue telefonate. Il passo successivo è stato usare il modello per stimare
la ricchezza del milione e mezzo di soggetti presenti nel database. È stato possibile anche stimare i luoghi di residenza
del campione, utilizzando le informazioni geografiche incorporate nei dati sulle chiamate. Mettendo tutto insieme - la ricchezza
stimata e la residenza stimata – si è ottenuta una mappa ad alta risoluzione della distribuzione geografica della ricchezza
in Ruanda, con una stima della ricchezza di ciascuna delle 2.148 unità amministrative del Ruanda con il maggior livello di
dettaglio possibile.
Pensate che non era nemmeno possibile verificare la validità di queste stime, perché nessuno in Ruanda aveva mai prodotto
stime per aree geografiche così piccole. Ma quando Blumenstock e i suoi collaboratori hanno aggregato le loro stime nei trenta
distretti del paese, hanno scoperto che queste stime erano molto simili a quelle della Demographic and Healthy Survey, da
tutti considerata la migliore indagine sui paesi in via di sviluppo. Certo, le due indagini erano arrivate a stime simili,
ma l'approccio di Blumenstock e colleghi era stato dieci volte più veloce e cinquanta volte meno costoso rispetto a tutte
le indagini precedenti. Stime di questo tipo, così più veloci ed economiche, creano enormi possibilità per tutti, ricercatori,
governi e aziende.
Lo studio di Blumenstock è una specie di test di Rorschach su una sequenza di tavole che riportano macchie d'inchiostro di
diversa forma: alla fine, quello che vediamo nella macchia dipende dalle nostre esperienze e dal nostro punto di vista. Infatti,
gli scienziati sociali vedono lo studio di Blumenstock come un nuovo strumento di misura per testare le teorie dello sviluppo
economico, mentre i data scientist un nuovo e interessante problema di machine learning. Gli imprenditori ci vedono un esempio
di strategia per valorizzare i big data che hanno già raccolto, mentre i difensori della privacy intravedono un richiamo inquietante
al fatto che viviamo in un tempo di controllo di massa. E, infine, i policy maker vedono un modo in cui la tecnologia possa
aiutare a creare un mondo migliore. Di fatto, lo studio è tutte queste cose insieme, ed è proprio per questo mix che dovemmo
vederlo come una finestra affacciata sul futuro della ricerca sociale nell'era digitale. […]
Uno scettico potrebbe osservare che nessuna di queste capacità è davvero nuova. In passato ci sono stati altri grandi passi
in avanti nelle capacità delle persone di comunicare (per esempio il telegrafo, e il ritmo con cui i computer diventano più
veloci è più o meno lo stesso dagli anni Sessanta. Ma quello che lo scettico dimentica è che a un certo punto l'aumento della
scala di per sé trasforma ogni cosa. Ad esempio, se si cattura un'immagine di un cavallo, si ottiene una fotografia. E se
si catturano 24 immagini di un cavallo al secondo, si ottiene un film. Certo, un film non è altro che un insieme di tante
foto, ma solo uno scettico ostinato direbbe che foto e film sono la stessa cosa. I ricercatori sociali stanno facendo un cambiamento
simile alla transizione dalla fotografia alla cinematografia.
Questo cambiamento, però, non significa che dobbiamo ignorare tutto quello che abbiamo imparato in passato. Proprio come i
principi della fotografia danno forma a quelli della cinematografia, i principi della ricerca sociale sviluppati negli ultimi
cento anni daranno forma alla ricerca sociale dei prossimi cento anni. […] Più in generale, i ricercatori sociali dovranno
unire idee della scienza sociale e della data science per sfruttare le opportunità dell'era digitale: nessuno dei due approcci
da solo sarà sufficiente.
Estratto dal primo capitolo di “Bit by Bit. Social Research in the Digital Age” (pubblicato da Princeton University Press nel 2018, in corso di traduzione per il Mulino, Bologna, a cura di Gabriele Ballarino e Flaminio Squazzoni)
Matthew Salganik è professore ordinario di sociologia a Princeton, esperto di big data e modelli sperimentali di analisi del
comportamento sociale.
Sarà a Milano il 21 marzo: Assieme ad Andreas Flache (sociologo all'Università di Groningen), Salganik sarà ospite presso
la Facoltà di Scienze Politiche dell'Università degli Studi di Milano il 21 marzo 2019 alle ore 11 per l'inaugurazione di
un nuovo laboratorio di ricerca sulla sociologia comportamentale, chiamato Behave, diretto dal prof. Flaminio Squazzoni, sociologo
al Dipartimento di Scienze Sociali e Politiche. Il laboratorio si propone di integrare modelli sperimentali e simulazione
al computer per l'analisi dei sistemi sociali, con attenzione alla formazione di studenti e giovani ricercatori in grado di
coniugare scienza sociale e modelli computazionali (per info: www.behavelab.org).
© Riproduzione riservata





