A partire da una ricerca condotta attraverso delle interviste in profondità e dei focus group ad esperti all’interno dell’archivio norvegese NSD e presso il CESSDA, è possibile formulare alcune riflessioni su come stanno cambiando le attività degli archivi dati per le scienze sociali in seguito alla diffusione dei big data negli studi sociologici. La possibilità di immagazzinare dati digitali e di strutturarli all’interno di database disponibili in rete ha favorito lo sviluppo di infrastrutture di dati (Lauriault et al. 2007) di cui gli archivi dati per le scienze sociali rappresentano un punto di eccellenza. Nati nel 1947 presso l’università del Michigan, ne furono creati altri in Germania (1960), in Olanda (1964) e nel Regno Unito (1967), ma è con il riconoscimento ricevuto dal Central European Social Science Data Archives (CESSDA), di unica infrastruttura di ricerca europea nel campo delle scienze sociali, che l’interesse verso queste infrastrutture di dati si è consolidato. Il CESSDA racchiude tutti gli archivi dati europei, compreso quello italiano Uni-data che ha sede presso l’università di Milano-Bicocca. I Social Sciences Data Archive «hanno svolto un’importante funzione nella diffusione delle tecniche di ricerca quantitativa, dell’analisi secondaria, dei programmi (package) statistici e gestionali, dell’accesso on-line agli archivi per mezzo di reti locali e internazionali, nonché della standardizzazione delle procedure di documentazione dei file» (Ercole, Stefanizzi, 1993, p.132). Il ruolo degli archivi consiste, in primo luogo, nel selezionare fonti di dati che possono essere integrate e rese disponibili ai ricercatori e agli analisti per ricerche secondarie. Inoltre, essi forniscono suggerimenti su come conservare, trattare e diffondere i dati e accompagnano gli utenti con servizi per la gestione, organizzazione e analisi delle matrici di dati. Queste organizzazioni svolgono pertanto un ruolo fondamentale per la creazione di comunità di pratica tra gli studiosi, facilitando il confronto istituzionale e stabilendo linee guida e protocolli condivisi. Il lavoro degli archivi dati è via via diventato più complesso a causa del proliferare di nuove fonti dati che non rispecchiano i requisiti di qualità dei dati standard e non adottano classificazioni, linee guida e protocolli internazionali. Dall’analisi delle interviste emerge, infatti, l’esigenza di sviluppare nuove strategie e nuovi strumenti in grado di integrare, collegare e ristrutturare le fonti di big data. Nonostante le tecnologie digitali abbiano notevolmente ampliato le opportunità di collegamento di dati provenienti da varie fonti per sviluppare nuove strategie, gli intervistati sottolineano che questa capacità di collegamento dei dati pone tuttavia di fronte a nuove sfide in materia di protezione e sicurezza. E non solo. I big data non soddisfano i requisiti di qualità dei dati standard; spesso l’accesso ai questi dati è negoziato o mediato da altri attori a discapito della qualità del dato stesso. Dall’analisi risulta evidente la necessità di attuare azioni in più direzioni: i) individuare diverse strategie di accesso e di integrazione dei dati; ii) definire nuovi standard; iii) rinnovare il sistema di metadati, e iv) sviluppare una diversa gestione dei termini e delle condizioni di privacy e consenso per l’uso e la diffusione dei big data. Allo stato attuale sono poche le iniziative che vanno verso questa direzione. Gli archivi dati oggetto di analisi restano, infatti, ancora legati alle pratiche e agli schemi tradizionali di gestione e organizzazione delle fonti. È assente, inoltre, una visione condivisa sui big data: le definizioni di big data fornite dagli esperti risultano essere generiche e spesso divergenti tra loro. Il fatto poi che le questioni sui grandi dati cambiano da big datum a big datum rende probabilmente ancora più difficile la generalizzazione di nuovi standard, metadati, data service e, più in generale, nuove pratiche, andando in qualche modo a limitare l’apertura di questi archivi verso le fonti big data e, quindi, la condivisione di questi tipi di dati.

Archivi dati e big data: alcune osservazioni a partire da una ricerca sul campo / Aragona, Biagio; Felaco, Cristiano. - (2018). (Intervento presentato al convegno AIS - LA SOCIOLOGIA E LE SOCIETA’ EUROPEE: STRUTTURE SOCIALI, CULTURE E ISTITUZIONI tenutosi a Catania nel 5-6 ottobre).

Archivi dati e big data: alcune osservazioni a partire da una ricerca sul campo

Biagio Aragona;Cristiano Felaco
2018

Abstract

A partire da una ricerca condotta attraverso delle interviste in profondità e dei focus group ad esperti all’interno dell’archivio norvegese NSD e presso il CESSDA, è possibile formulare alcune riflessioni su come stanno cambiando le attività degli archivi dati per le scienze sociali in seguito alla diffusione dei big data negli studi sociologici. La possibilità di immagazzinare dati digitali e di strutturarli all’interno di database disponibili in rete ha favorito lo sviluppo di infrastrutture di dati (Lauriault et al. 2007) di cui gli archivi dati per le scienze sociali rappresentano un punto di eccellenza. Nati nel 1947 presso l’università del Michigan, ne furono creati altri in Germania (1960), in Olanda (1964) e nel Regno Unito (1967), ma è con il riconoscimento ricevuto dal Central European Social Science Data Archives (CESSDA), di unica infrastruttura di ricerca europea nel campo delle scienze sociali, che l’interesse verso queste infrastrutture di dati si è consolidato. Il CESSDA racchiude tutti gli archivi dati europei, compreso quello italiano Uni-data che ha sede presso l’università di Milano-Bicocca. I Social Sciences Data Archive «hanno svolto un’importante funzione nella diffusione delle tecniche di ricerca quantitativa, dell’analisi secondaria, dei programmi (package) statistici e gestionali, dell’accesso on-line agli archivi per mezzo di reti locali e internazionali, nonché della standardizzazione delle procedure di documentazione dei file» (Ercole, Stefanizzi, 1993, p.132). Il ruolo degli archivi consiste, in primo luogo, nel selezionare fonti di dati che possono essere integrate e rese disponibili ai ricercatori e agli analisti per ricerche secondarie. Inoltre, essi forniscono suggerimenti su come conservare, trattare e diffondere i dati e accompagnano gli utenti con servizi per la gestione, organizzazione e analisi delle matrici di dati. Queste organizzazioni svolgono pertanto un ruolo fondamentale per la creazione di comunità di pratica tra gli studiosi, facilitando il confronto istituzionale e stabilendo linee guida e protocolli condivisi. Il lavoro degli archivi dati è via via diventato più complesso a causa del proliferare di nuove fonti dati che non rispecchiano i requisiti di qualità dei dati standard e non adottano classificazioni, linee guida e protocolli internazionali. Dall’analisi delle interviste emerge, infatti, l’esigenza di sviluppare nuove strategie e nuovi strumenti in grado di integrare, collegare e ristrutturare le fonti di big data. Nonostante le tecnologie digitali abbiano notevolmente ampliato le opportunità di collegamento di dati provenienti da varie fonti per sviluppare nuove strategie, gli intervistati sottolineano che questa capacità di collegamento dei dati pone tuttavia di fronte a nuove sfide in materia di protezione e sicurezza. E non solo. I big data non soddisfano i requisiti di qualità dei dati standard; spesso l’accesso ai questi dati è negoziato o mediato da altri attori a discapito della qualità del dato stesso. Dall’analisi risulta evidente la necessità di attuare azioni in più direzioni: i) individuare diverse strategie di accesso e di integrazione dei dati; ii) definire nuovi standard; iii) rinnovare il sistema di metadati, e iv) sviluppare una diversa gestione dei termini e delle condizioni di privacy e consenso per l’uso e la diffusione dei big data. Allo stato attuale sono poche le iniziative che vanno verso questa direzione. Gli archivi dati oggetto di analisi restano, infatti, ancora legati alle pratiche e agli schemi tradizionali di gestione e organizzazione delle fonti. È assente, inoltre, una visione condivisa sui big data: le definizioni di big data fornite dagli esperti risultano essere generiche e spesso divergenti tra loro. Il fatto poi che le questioni sui grandi dati cambiano da big datum a big datum rende probabilmente ancora più difficile la generalizzazione di nuovi standard, metadati, data service e, più in generale, nuove pratiche, andando in qualche modo a limitare l’apertura di questi archivi verso le fonti big data e, quindi, la condivisione di questi tipi di dati.
2018
Archivi dati e big data: alcune osservazioni a partire da una ricerca sul campo / Aragona, Biagio; Felaco, Cristiano. - (2018). (Intervento presentato al convegno AIS - LA SOCIOLOGIA E LE SOCIETA’ EUROPEE: STRUTTURE SOCIALI, CULTURE E ISTITUZIONI tenutosi a Catania nel 5-6 ottobre).
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11588/757272
Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
social impact