
La gestione dei dati consiste nella produzione, raccolta, analisi, preservazione e condivisione dei dati.

Azioni principali: identificare i tipi di dati, identificare i metadati, pianificare la loro organizzazione in dataset, e redigere un Data Management Plan (DMP).

I dati sono record fattuali raccolti, generati o riutilizzati come base di analisi, ragionamenti, discussioni o calcoli.
Vengono usati da studiosi e scienziati come strumenti per comprendere il mondo e generare conoscenza.

Dati organizzati in uno schema predefinito (es. tabella).
Solitamente, sono facili da gestire e analizzare con l'uso di database relazionali e linguaggi di interrogazione specifici (es. SQL).
Esempi: tabelle di database, fogli di calcolo, ecc.

Dati con una struttura parziale e flessibile.
Sono più flessibili dei dati strutturati ma richiedono spesso una strutturazione minima che segua determinati schemi di codifica e vocabolari controllati.
Esempi: documenti XML, documenti JSON, documenti HTML, dataset RDF, ecc.

Dati che mancano formalmente di una struttura organizzata.
Una loro analisi richiede l'utilizzo di tecniche avanzate di processamento dei dati, come l’elaborazione del linguaggio naturale (NLP).
Esempi: documenti di testo, registrazioni, immagini, ecc.
Sul Web esistono tantissimi dataset disponibili in formato aperto, pubblicati e conservati all’interno di repository dedicate.
Alcuni esempi di risorse per trovare dati:
Ma ovviamente dipende anche dal tipo di dati con cui avete bisogno di lavorare.
Per trovare, contestualizzare e utilizzare i dataset, è fondamentale controllare i metadati che li descrivono.
Per esempio, una delle prime attività da fare quando si lavora con i dati è controllare la licenza assegnata ad essi, per capire se e come possono essere utilizzati.
Più in generale, è fondamentale controllare la documentazione che accompagna i dati, in modo da poterli capire - e, di conseguenza, utilizzare con criterio e responsabilità.
… Il discorso resta lo stesso!
Li identificate, a seconda delle vostre necessità, e li documentate fin dall’inizio, in maniera graduale e continua.
Ciò che è considerabile dato dipende da chi lo usa, come, e per quale scopo.
Un oggetto diventa un dato quando è visto come prova reale o potenziale per una o più asserzioni riguardanti un certo fenomeno.
Esempi:
Una descrizione critica di tutto quello che serve ad un’altra persona o ai voi stessi del futuro per trovare, comprendere, e contestualizzare i vostri dati in maniera indipendente.
I dati senza documentazione sono uno spreco di soldi, tempo, risorse, inutili (o addirittura dannosi).
Esempi: README, metadati, ecc.



Una forma di documentazione strutturata che descrive le caratteristiche di un oggetto, come autore, contenuto, qualità, formato, posizione, diritti di accesso, ecc.
Possono essere utilizzati per descrivere tanto gli oggetti fisici (es. frammenti di vaso, libri, campioni), quanto gli oggetti digitali (es. documenti, immagini, dataset, software).
Strutture concettuali che specificano quali metadati utilizzare e secondo quali regole.
Stabiliscono un significato unico e non ambiguo per i metadati, costituendo una vera e propria lingua comune che favorisce l’ineroperabilità dei dati descritti.
Spesso specifici per ambito disciplinare, consolidati a livello delle comunità di ricerca, e implementati da piattaforme online (es. cataloghi, registri, basi di dati, portali, ecc.) e da infrastrutture di archiviazione e accesso a lungo termine.
Esempi:
I metadati fatti bene hanno un impatto molto profondo su
Ma lo vedremo meglio durante la prossima lezione teorica…
Documento vivente che contiene informazioni su come gestire, organizzare, documentare tutti i dati che in qualche maniera fanno parte del progetto durante il suo ciclo di vita.
Può intimidire e sembrare eccessivo, ma serve a pensare sistematicamente attraverso il processo di ricerca da una “prospettiva dei dati”.
Esempio: Gualandi, B., & Peroni, S. (2024). Data Management Plan: second version (1.0). Zenodo. https://doi.org/10.5281/zenodo.10727879
Trattandosi di un documento di testo, è possibile scriverlo a mano, utilizzare template esistenti da compilare, oppure utilizzare strumenti per una sua generazione semi-automatica.
Esempi:
Noi lo faremo alla vecchia maniera, durante la prossima lezione, scrivendolo a mano in Markdown.
Nel corso dei secoli, le guide turistiche di Roma evolvono da strumenti medievali pieni di leggende a opere scientifiche e artistiche del Rinascimento, per poi trasformarsi in guide moderne, pratiche e orientate al turismo di massa nel XVIII e XIX secolo.
Sin dall’antichità, Roma è stata una meta di viaggi, inizialmente per motivi politici e culturali, e poi come importante centro di pellegrinaggio cristiano a partire dal IV secolo, grazie alla presenza dei sepolcri dei martiri. Le prime guide turistiche erano influenzate da leggende e etimologie medievali.
Nel Rinascimento, si sviluppa un approccio più erudito e scientifico, con un maggiore studio delle rovine romane e la ricostruzione della città antica basata su fonti classiche e iscrizioni.
Più avanti, le guide si dividono in due tipologie: quelle per viaggiatori eruditi, ricche di dettagli storici e artistici, e quelle per il pubblico più ampio, con informazioni più pratiche.
Le guide diventano poi strumenti pratici per i turisti, con itinerari dettagliati e descrizioni più maneggevoli e illustrate.
Infine, verso il XIX secolo, le guide diventano caratterizzate da itinerari precisi, informazioni pratiche e dettagli su tariffe, alloggi ed eventi locali.
Un’analisi di questi elementi può aiutare a capire come si evolve la citazione nel corso del tempo, quali elementi tendono ad essere associati agli altri, quali tendono ad emergere più spesso dal discorso degli autori, ecc.
Link ai dati (documenti non strutturati, in formato PDF e TXT, ottenuti tramite OCR): https://liveunibo-my.sharepoint.com/:f:/g/personal/sebastian_barzaghi2_unibo_it/EhinmY5b4h1Eoo-t2JOpaHwBMAKdc782rxufWuaX5k7flA?e=hB1d1n.
Ognuno di voi dovrà portare un progetto di gestione dei dati riguardante questo dominio di conoscenza, sulla base dei documenti disponibili (che vi fornirò a tempo debito).
Il progetto avrà la forma di una repository Git, pubblicata su GitHub, con documentazione scritta in Markdown (inclusi i vari README, un DMP, e una piccola pagina Web che servirà da principale vetrina di comunicazione), e contenente anche i dati che utilizzerete e che produrrete. I dati, inoltre, dovranno essere pubblicati anche su Zenodo.
All’esame mi dovrete presentare il progetto tramite la pagina Web, che dovrà contenere in sostanza una descrizione succinta di cosa avete fatto e come.
Ognuno di voi dovrà portare avanti una linea di progetto abbastanza diversa dalle altre.
Un paio di esempi al volo:
Leggete il README per maggiori informazioni: https://github.com/dhdmch/2024-2025.
Non dovete fare un lavoro perfetto. Un progetto digitale è sempre migliorabile, anche dopo un esame.
La cosa che più mi interessa è che abbiate consapevolezza delle tematiche trattate, della metodologia, e degli strumenti utilizzati, e che sappiate trasmettermi questa consapevolezza durante l’esposizione.