
I dati sono record fattuali raccolti, generati o riutilizzati come base di analisi, ragionamenti, discussioni o calcoli.
Vengono usati da studiosi e scienziati come strumenti per comprendere il mondo e generare conoscenza.
I dati non hanno valore di verità di per sé, né possono essere visti come rappresentazioni dirette dei fenomeni studiati.
Ciò che è considerabile dato dipende da chi lo usa, come, e per quale scopo.
Un oggetto diventa un dato quando è visto come prova reale o potenziale per una o più asserzioni riguardanti un certo fenomeno.

Un dataset è una raccolta di dati organizzati secondo criteri precisi.
La sua corretta gestione garantisce l'efficienza, l'affidabilità e l'utilità dei dati.
Non c’è consenso su che cosa siano i dati nelle discipline umanistiche.
Il termine stesso discipline umanistiche è ampio e racchiude in sé domini di conoscenza estremamente diversi.
Ogni tipo di ricerca produce o riusa dei dati, anche se il termine dato non viene utilizzato in certi contesti.
Esempio: un ricercatore utilizza delle fonti (primarie o secondarie) per rispondere alle proprie domande di ricerca, producendo almeno una bibliografia.

La Scienza Aperta è un insieme di movimenti e pratiche che mirano a rendere la conoscenza scientifica più trasparente, accessibile e riutilizzabile per tutti.
La maggiore riproducibilità e trasparenza dei metodi e dei risultati della ricerca garantiscono maggiore scientificità.
La conoscenza scientifica è un prodotto di collaborazione sociale, e quindi appartiene alla comunità.
Una scienza più aperta massimizza la possibilità per il singolo ricercatore di ricevere un maggior numero di citazioni, una maggiore copertura mediatica, un numero più ampio di collaborazioni e opportunità di lavoro e finanziamento.
Inoltre, rientra sempre più spesso tra i requisiti dei finanziatori a livello nazionale e internazionale.
Fare Scienza Aperta vuol dire creare, usare e condividere dati aperti, cioé dati liberamente disponibili per l’accesso e il (ri)utilizzo.
Idealmente, i dati non dovrebbero avere restrizioni da copyright, brevetti o altri meccanismi di controllo.
Nella realtà, bisogna puntare ad avere dati aperti quanto più possibile, chiusi secondo necessità.
Molti ricercatori usano come dati di ricerca fonti primarie, che spesso sono fisiche e raramente digitalizzate.
I sistemi semiotici delle discipline umanistiche tendono ad essere specifici, impliciti, individualistici, dati per scontato.
I dati sono difficilmente accessibili a causa di copyright stringenti e licenze inadatte alle dinamiche della ricerca contemporanea.
I dati culturali sono complessi e raramente documentati in modo da facilitarne l’integrazione, la comprensione e il riutilizzo da parte di altri.
Anche solo piccoli cambiamenti nel flusso di lavoro, come l’adozione di ORCID e l’uso di strumenti come Zenodo, possono fare una grande differenza.
Tra i vari vantaggi troviamo:
Le tecnologie digitali forniscono l’importante opportunità alle discipline umanistiche di mettere in discussione paradigmi esistenti e sviluppare nuovi metodi di indagine e disseminazione scientifica che siano accessibili e trasparenti.
Il campo in rapida espansione che esplora, sviluppa e applica metodi e tecnologie digitali nelle discipline umanistiche è spesso chiamato Digital Humanities.
Il termine Digital Humanities (DH) descrive contemporaneamente una comunità, un insieme di metodi e di strumenti, un cambio di paradigma, un campo di ricerca.
Comprende una vasta gamma di attività, come la creazione di dataset e lo sviluppo di strumenti informatici necessari per la ricerca, la didattica e la disseminazione scientifica nelle scienze umanistiche.

Collezioni di dati strutturati, rese disponibili ad un pubblico più ampio per ulteriori studi e analisi.

Astrazioni per organizzare e descrivere dati in formati strutturati e azionabili dalle macchine.

Software e applicazioni che permettono di eseguire determinate operazioni sui dati (es. ricerca, caricamento, manipolazione, pubblicazione, ecc.) tramite interfacce visive e/o di programmazione.
La struttura di base di qualsiasi progetto di DH è una combinazione di
I risultati di un progetto di Digital Humanities consistono spesso in dati, siti Web, applicazioni, modelli, metodologie, documentazione e altre risorse che dovrebbero essere rese accessibili ad altri agenti (umani e software), per facilitare la loro condivisione e riuso, la riproducibilità del processo di ricerca, e così via.
Per sviluppare in maniera corretta un progetto e produrre un impatto concreto, le DH richiedono risultati ben strutturati, documentati, accessibili, sostenibili, utilizzabili.
Per farlo, è necessario seguire una serie di attività rigorose, orientate ad una consapevole gestione dei dati.
La gestione dei dati (o Data Management, DM) è l’organizzazione critica dei dati durante l’intero ciclo di ricerca.
Tra gli obiettivi del DM, troviamo:

La gestione dei dati consiste nella produzione, raccolta, analisi, preservazione e condivisione dei dati.


Azioni principali: identificare i tipi di dati, identificare i metadati, pianificare la loro organizzazione in dataset, e redigere un Data Management Plan (DMP).

Azioni principali: raccogliere o creare i dati, elaborare i dati per renderli utilizzabili (pulizia, combinazione, trasformazione, controllo qualità), analizzare i dati per generare risultati utili, produrre la documentazione dei dati e delle metodologie utilizzate.

Azioni principali: valutare quali dati depositare, scegliere la repository, depositare i dati, applicare una licenza ai dati.
Collezione digitale di 4000+ opere d’arte raffiguranti scene della mitologia classica.
Ogni oggetto della collezione è descritto da una serie di metadati.
Lavoreremo su alcune sezioni di questo dataset, sperimentando con strumenti e metodi in maniera pratica e simulando ciò che poi dovrete portare all’esame.