La grande sfida

Lezione 01 del corso di Digital Humanities e Data Management per i Beni Culturali (2024/2025)

Sebastian Barzaghi | sebastian.barzaghi2@unibo.it | https://orcid.org/0000-0002-0799-1527 | https://www.unibo.it/sitoweb/sebastian.barzaghi2/

Partiamo dai dati

Un dato è una fonte di conoscenza

Fonte: Noppe, N., Vanvelk, J., & Callens, N. (2023). The hands-on guide to research data management for KU Leuven researchers, students, and research support staff in the humanities and social sciences. Zenodo. https://doi.org/10.5281/zenodo.8010618.

I dati sono record fattuali raccolti, generati o riutilizzati come base di analisi, ragionamenti, discussioni o calcoli.

Vengono usati da studiosi e scienziati come strumenti per comprendere il mondo e generare conoscenza.

Un dato è una categoria relazionale

I dati non hanno valore di verità di per sé, né possono essere visti come rappresentazioni dirette dei fenomeni studiati.

Ciò che è considerabile dato dipende da chi lo usa, come, e per quale scopo.

Un oggetto diventa un dato quando è visto come prova reale o potenziale per una o più asserzioni riguardanti un certo fenomeno.

I dati sono raccolti in dataset

Fonte: Gontier, C., Jordan, J., & Petrovici, M. A. (2022). DELAUNAY: a dataset of abstract art for psychophysical and machine learning research. arXiv preprint arXiv:2201.12123. https://doi.org/10.48550/arXiv.2201.12123.

Un dataset è una raccolta di dati organizzati secondo criteri precisi.

La sua corretta gestione garantisce l'efficienza, l'affidabilità e l'utilità dei dati.

Non è facile parlare di dati nelle discipline umanistiche

Non c’è consenso su che cosa siano i dati nelle discipline umanistiche.

Il termine stesso discipline umanistiche è ampio e racchiude in sé domini di conoscenza estremamente diversi.

Anche gli umanisti usano e producono dati

Ogni tipo di ricerca produce o riusa dei dati, anche se il termine dato non viene utilizzato in certi contesti.

Esempio: un ricercatore utilizza delle fonti (primarie o secondarie) per rispondere alle proprie domande di ricerca, producendo almeno una bibliografia.

Se tutti producono e usano dati, dobbiamo discutere su come questi dati possono essere condivisi e riutilizzati.

Apriti, Scienza

La scienza fatta bene

Melanie Imming, Jon Tennant, & Ivo Grigorov. (2018). Stickers Open Science just science done right (IT). Zenodo. https://doi.org/10.5281/zenodo.2613332.

La Scienza Aperta è un insieme di movimenti e pratiche che mirano a rendere la conoscenza scientifica più trasparente, accessibile e riutilizzabile per tutti.

Argomento Scientifico

La maggiore riproducibilità e trasparenza dei metodi e dei risultati della ricerca garantiscono maggiore scientificità.

Argomento Sociologico

La conoscenza scientifica è un prodotto di collaborazione sociale, e quindi appartiene alla comunità.

Argomento Utilitaristico

Una scienza più aperta massimizza la possibilità per il singolo ricercatore di ricevere un maggior numero di citazioni, una maggiore copertura mediatica, un numero più ampio di collaborazioni e opportunità di lavoro e finanziamento.

Inoltre, rientra sempre più spesso tra i requisiti dei finanziatori a livello nazionale e internazionale.

La Scienza Aperta viene costruita sui dati aperti

Fare Scienza Aperta vuol dire creare, usare e condividere dati aperti, cioé dati liberamente disponibili per l’accesso e il (ri)utilizzo.

Idealmente, i dati non dovrebbero avere restrizioni da copyright, brevetti o altri meccanismi di controllo.

Nella realtà, bisogna puntare ad avere dati aperti quanto più possibile, chiusi secondo necessità.

E per quanto riguarda le discipline umanistiche?

La ricerca umanistica è dominata da paradigmi tradizionali

Molti ricercatori usano come dati di ricerca fonti primarie, che spesso sono fisiche e raramente digitalizzate.

I sistemi semiotici delle discipline umanistiche tendono ad essere specifici, impliciti, individualistici, dati per scontato.

I dati sono difficilmente accessibili a causa di copyright stringenti e licenze inadatte alle dinamiche della ricerca contemporanea.

I dati culturali sono complessi e raramente documentati in modo da facilitarne l’integrazione, la comprensione e il riutilizzo da parte di altri.

Scienza Aperta per umanisti: perché?

Anche solo piccoli cambiamenti nel flusso di lavoro, come l’adozione di ORCID e l’uso di strumenti come Zenodo, possono fare una grande differenza.

Tra i vari vantaggi troviamo:

  • Nuove prospettive di ricerca;
  • Un migliore accesso ai dati e ai materiali;
  • Una maggiore diffusione (e potenzialmente impatto) dei risultati;
  • Una maggiore rappresentazione di posizioni marginali;
  • Allineamento alle richieste dell’UE (e quindi maggiore disponibilità di finanziamenti);
  • Una maggiore credibilità della ricerca umanistica.

Il ruolo fondamentale del digitale

Le tecnologie digitali forniscono l’importante opportunità alle discipline umanistiche di mettere in discussione paradigmi esistenti e sviluppare nuovi metodi di indagine e disseminazione scientifica che siano accessibili e trasparenti.

Il campo in rapida espansione che esplora, sviluppa e applica metodi e tecnologie digitali nelle discipline umanistiche è spesso chiamato Digital Humanities.

Cambio di paradigma

Cosa facciamo nelle DH?

Il termine Digital Humanities (DH) descrive contemporaneamente una comunità, un insieme di metodi e di strumenti, un cambio di paradigma, un campo di ricerca.

Comprende una vasta gamma di attività, come la creazione di dataset e lo sviluppo di strumenti informatici necessari per la ricerca, la didattica e la disseminazione scientifica nelle scienze umanistiche.

Creiamo dataset

Fonte: Valentina Pasqual, & Francesca Tomasi. (2021). mythlod/1.0 (1.0) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.4639821.

Collezioni di dati strutturati, rese disponibili ad un pubblico più ampio per ulteriori studi e analisi.

Creiamo modelli

Fonte: Barzaghi, S., & Peroni, S. (2024). Cultural Heritage Acquisition and Digitisation Application Profile. https://w3id.org/dharc/ontology/chad-ap.

Astrazioni per organizzare e descrivere dati in formati strutturati e azionabili dalle macchine.

Creiamo strumenti

Fonte: Moro, A. (2021). Edizione Nazionale delle Opere di Aldo Moro, voll., Bologna, Università di Bologna. ISBN: 9788854970496; DOI: https://doi.org/10.6092/unibo/aldomoro.

Software e applicazioni che permettono di eseguire determinate operazioni sui dati (es. ricerca, caricamento, manipolazione, pubblicazione, ecc.) tramite interfacce visive e/o di programmazione.

Queste attività prendono forma nei progetti

La struttura di base di qualsiasi progetto di DH è una combinazione di

  • risorse digitali, memorizzate in una
  • struttura (es. un database, un file system) e accessibili tramite un insieme di
  • servizi (es. interrogazione, ricerca, elaborazione, analisi) resi disponibili attraverso un'
  • interfaccia che supporta l’esperienza dell’utente.

Il risultato non è mai uno

I risultati di un progetto di Digital Humanities consistono spesso in dati, siti Web, applicazioni, modelli, metodologie, documentazione e altre risorse che dovrebbero essere rese accessibili ad altri agenti (umani e software), per facilitare la loro condivisione e riuso, la riproducibilità del processo di ricerca, e così via.

Dipende tutto dalla gestione dei dati

Per sviluppare in maniera corretta un progetto e produrre un impatto concreto, le DH richiedono risultati ben strutturati, documentati, accessibili, sostenibili, utilizzabili.

Per farlo, è necessario seguire una serie di attività rigorose, orientate ad una consapevole gestione dei dati.

Un’impresa necessaria

Una lettera d’amore ai propri dati

La gestione dei dati (o Data Management, DM) è l’organizzazione critica dei dati durante l’intero ciclo di ricerca.

Tra gli obiettivi del DM, troviamo:

  • rendere il processo di ricerca efficiente;
  • rendere i dati interpretabili, comprensibili e rintracciabili nel tempo;
  • favorire l’integrità scientifica della ricerca;
  • stimolare la collaborazione tra ricercatori.

Il DM consiste in una serie di attività complesse

Fonte: Gualandi, B. (2024). Data stewardship e open science nelle discipline umanistiche. Zenodo. https://doi.org/10.5281/zenodo.12937887.

La gestione dei dati consiste nella produzione, raccolta, analisi, preservazione e condivisione dei dati.

Vediamolo più da vicino

Gualandi, B., Caldoni, G., & Marino, M. (2022). Research Data Management: Data Lifecycle. Zenodo. https://doi.org/10.5281/zenodo.7249051.

Pianificazione

Fonte: Gualandi, B., Caldoni, G., & Marino, M. (2022). Research Data Management: Data Lifecycle. Zenodo. https://doi.org/10.5281/zenodo.7249051.

Azioni principali: identificare i tipi di dati, identificare i metadati, pianificare la loro organizzazione in dataset, e redigere un Data Management Plan (DMP).

Produzione, raccolta e analisi

Fonte: Gualandi, B., Caldoni, G., & Marino, M. (2022). Research Data Management: Data Lifecycle. Zenodo. https://doi.org/10.5281/zenodo.7249051.

Azioni principali: raccogliere o creare i dati, elaborare i dati per renderli utilizzabili (pulizia, combinazione, trasformazione, controllo qualità), analizzare i dati per generare risultati utili, produrre la documentazione dei dati e delle metodologie utilizzate.

Preservazione e condivisione

Fonte: Gualandi, B., Caldoni, G., & Marino, M. (2022). Research Data Management: Data Lifecycle. Zenodo. https://doi.org/10.5281/zenodo.7249051.

Azioni principali: valutare quali dati depositare, scegliere la repository, depositare i dati, applicare una licenza ai dati.

Il caso di studio

Mythologiae

https://mythologiae.unibo.it/

Collezione digitale di 4000+ opere d’arte raffiguranti scene della mitologia classica.

Ogni oggetto della collezione è descritto da una serie di metadati.

Lavoreremo su alcune sezioni di questo dataset, sperimentando con strumenti e metodi in maniera pratica e simulando ciò che poi dovrete portare all’esame.

Fine

Lezione 01 del corso di Digital Humanities e Data Management per i Beni Culturali (2024/2025)

Sebastian Barzaghi | sebastian.barzaghi2@unibo.it | https://orcid.org/0000-0002-0799-1527 | https://www.unibo.it/sitoweb/sebastian.barzaghi2/