Digital Humanities

Lezione 01 del corso di Abilità Informatiche (2024/2025)

Sebastian Barzaghi | sebastian.barzaghi2@unibo.it | https://orcid.org/0000-0002-0799-1527 | https://www.unibo.it/sitoweb/sebastian.barzaghi2/

Partiamo dai dati

I libri sono dati?

I manoscritti sono dati?

I film sono dati?

I quadri sono dati?

I videogiochi sono dati?

I modelli 3D sono dati?

Dipende

Cos’è un dato?

Problemi epistemologici: definizioni numerose, ambigue e diverse a seconda della disciplina di riferimento, o che variano addirittura da persona a persona.

“Qualcosa che è dato” dalla natura allo scienziato

Datum (participio passato di dare): “qualcosa che è dato” (dalla natura allo scienziato).

Un dato non esiste di per sé, ma deve essere generato o raccolto tramite sensori o attraverso uno sforzo umano.

Da “Datum” a Captum (“qualcosa che è preso”).

“Qualcosa che viene preso” dalla natura da parte dello scienziato

Fonte: Noppe, N., Vanvelk, J., & Callens, N. (2023). The hands-on guide to research data management for KU Leuven researchers, students, and research support staff in the humanities and social sciences. Zenodo. https://doi.org/10.5281/zenodo.8010618.

I dati sono record fattuali raccolti, generati o riutilizzati come base di analisi, ragionamenti, discussioni o calcoli.

Vengono usati da scienziati (ma anche dai non esperti) come strumenti per comprendere il mondo e generare conoscenza.

Categorie relazionali

I dati non hanno valore di verità di per sé, né possono essere visti come rappresentazioni dirette dei fenomeni studiati.

Ciò che è considerabile “dato” dipende da chi lo usa, come, e per quale scopo.

Percepire, osservare, raccogliere dati sono tutti atti interpretativi, in un contesto che dà forma ai dati e ne definisce i limiti.

Un esempio: tassi di violenza domestica

Nell’articolo di Bala citato qui sotto, viene commentato un articolo precedente di Moloney et al. in cui le stime dei tassi di violenza domestica sono sottorappresentati.

Fino a tempi recenti, le vittime di abuso infantile e violenza coniugale erano ignorate e raramente denunciavano (in altre parole: esistevano pochissimi dati).

Alla fine del ventesimo secolo, grazie all’influenza di attiviste femministe, emerse una maggiore consapevolezza e supporto per le vittime, con un aumento delle denunce (e quindi dei dati, anche falsati).

I dati sono raccolti in dataset

Fonte: Gontier, C., Jordan, J., & Petrovici, M. A. (2022). DELAUNAY: a dataset of abstract art for psychophysical and machine learning research. arXiv preprint arXiv:2201.12123. https://doi.org/10.48550/arXiv.2201.12123.

Un dataset è una raccolta di dati organizzati secondo determinati criteri.

Dataset come strumenti potenti ma imperfetti

Fonte: Cerf, E. (2023). Researchers’ tool finds bias in state-of-the-art generative AI model. UC Santa Cruz. https://news.ucsc.edu/2023/08/t2iat.html.

Riflette le circostanze che hanno portato alla sua creazione e gestione (comunità, individui, organizzazioni, ambienti, strumenti, limiti, bias, responsabilità…).

Non è facile parlare di dati nelle discipline umanistiche

Non c’è consenso su che cosa siano i dati nelle discipline umanistiche.

Il termine stesso discipline umanistiche è ampio e racchiude in sé domini di conoscenza estremamente diversi.

Anche gli umanisti usano e producono dati

Ogni tipo di ricerca produce o riusa dei dati, anche se il termine dato non viene utilizzato in certi contesti.

Esempio: un ricercatore utilizza delle fonti (primarie o secondarie) per rispondere alle proprie domande di ricerca, producendo almeno una bibliografia.

Esempio: bibliografia

Il ruolo fondamentale del digitale

Le tecnologie digitali mettono in discussione paradigmi esistenti e permettono di sviluppare nuovi metodi di indagine, produzione e disseminazione scientifica dei dati umanistici.

Un cambio di paradigma

Digital Humanities

Il campo in rapida espansione che esplora, sviluppa e applica metodi e tecnologie digitali alle discipline umanistiche.

Costituito da più discipline in cui vengono utilizzate tecnologie digitali per esplorare domande di ricerca in ambito umanistico, o formulare domande di ricerca umanistiche su questioni riguardanti tecnologie digitali.

Cosa facciamo nelle DH?

Fonte: Betik, B. & Cors, A. (2023). 5 Reasons Why All Graduate Education Should Include the Digital Humanities. Edinburgh University Press. https://euppublishingblog.com/2023/10/20/graduate-education-digital-humanities/.

Comprende una vasta gamma di attività, come la creazione di dataset e lo sviluppo di strumenti informatici necessari per la ricerca, la didattica e la disseminazione scientifica nelle scienze umanistiche.

Creiamo dataset

Fonte: Valentina Pasqual, & Francesca Tomasi. (2021). mythlod/1.0 (1.0) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.4639821.

Collezioni di dati strutturati, rese disponibili ad un pubblico più ampio per ulteriori studi e analisi.

Creiamo modelli

Fonte: Barzaghi, S., & Peroni, S. (2024). Cultural Heritage Acquisition and Digitisation Application Profile. https://w3id.org/dharc/ontology/chad-ap.

Astrazioni per organizzare e descrivere dati in formati strutturati e azionabili dalle macchine.

Creiamo strumenti

Fonte: Moro, A. (2021). Edizione Nazionale delle Opere di Aldo Moro, voll., Bologna, Università di Bologna. ISBN: 9788854970496; DOI: https://doi.org/10.6092/unibo/aldomoro.

Software e applicazioni che permettono di eseguire determinate operazioni sui dati (es. ricerca, caricamento, manipolazione, pubblicazione, ecc.) tramite interfacce visive e/o di programmazione.

Educare a costruire

Compito di incoraggiare (cioè ’educare’) nella ‘costruzione’ (processo intellettuale, sociale, ideologico) di qualcosa che genera conoscenza all’interno del dibattito accademico, pubblico e privato.

  • Abilità pratiche;
  • Approcci interpretativi;
  • Valorizzazione, diffusione e utilizzo dei risultati della ricerca.

Progetti digitali

Un progetto che utilizza metodi e tecnologie digitali come parte integrante del processo di ricerca, della diffusione dei risultati della ricerca e dell’interazione con un vasto pubblico di utenti.

Es. edizioni digitali, basi di dati bibliografiche, applicazioni di analisi dei dati, applicazioni GIS, ecc.

Elementi fondamentali di un progetto digitale

  • Uso di metodi di analisi basati sui dati;
  • Gestione delle risorse digitali (es. un insieme di documenti o dati salvati in uno o più file in un formato specifico);
  • Organizzazione strutturata, informativa e interpretabile delle risorse;
  • Pubblicazione digitale delle risorse.

Elementi fondamentali di un progetto digitale

La struttura di base di qualsiasi progetto di DH è una combinazione di

  • risorse digitali, memorizzate in una
  • struttura (es. un database, un file system) e accessibili tramite un insieme di
  • servizi (es. interrogazione, ricerca, elaborazione, analisi) resi disponibili attraverso un’
  • interfaccia che supporta l’esperienza dell’utente.

Il risultato non è mai uno

I risultati di un progetto digitale consistono spesso in dati, siti Web, applicazioni, modelli, metodologie, documentazione e altre risorse che dovrebbero essere rese accessibili ad altri agenti (umani e software), per facilitare la loro condivisione e riuso, la riproducibilità del processo di ricerca, e così via.

Ciclo di vita di un progetto digitale

Fonte: https://localcontexts.org/traditional-digital-content-lifecycle/.

Creare uno strumento scientificamente valido, affidabile e riutilizzabile, capace di affrontare domande di ricerca, metodologie e temi pertinenti alle discipline umanistiche (testo, interpretazione, incertezza, esperienza umana, ecc.).

Produzione

Fonte: https://localcontexts.org/traditional-digital-content-lifecycle/.

Selezione delle risorse, acquisizione digitale e/o trascrizione delle risorse, produzione/riuso di dataset.

Esempio: raccolta e trascrizione di una serie di documenti per la digitalizzazione per un'edizione digitale.

Descrizione

Fonte: https://localcontexts.org/traditional-digital-content-lifecycle/.

Analisi del contenuto, contesto e utenti; selezione e/o progettazione di schemi di metadati, vocabolari controllati e altri standard.

Esempio: definire lo schema di markup per la struttura del documento e le ontologie per i contenuti e le relazioni.

Gestione

Fonte: https://localcontexts.org/traditional-digital-content-lifecycle/.

Riflessione sul servizio di archiviazione; controllo qualità dei dati; garantire la loro accessibilità a lungo termine.

Esempio: scegliere il server per ospitare l'edizione digitale, pubblicare il dataset su una repository online (es. Zenodo).

Scoperta

Fonte: https://localcontexts.org/traditional-digital-content-lifecycle/.

Elaborazione delle risorse; analisi e interrogazione delle risorse; ragionamento a livello di infrastruttura per ospitare i risultati.

Esempio: conversione semi-automatica dei documenti in formati adatti alla pubblicazione semantica tramite un'applicazione e/o degli script.

Uso e riuso

Fonte: https://localcontexts.org/traditional-digital-content-lifecycle/.

Progettazione e sviluppo di interfacce; progettazione e sviluppo di servizi di query e download; sviluppo di politiche di condivisione dei dati e delle applicazioni.

Esempio: implementazione di meccanismi di ricerca, visualizzazioni dei dati, download, ecc.

Alcuni esempi (tutti UNIBO!)

Fine

Lezione 01 del corso di Abilità Informatiche (2024/2025)

Sebastian Barzaghi | sebastian.barzaghi2@unibo.it | https://orcid.org/0000-0002-0799-1527 | https://www.unibo.it/sitoweb/sebastian.barzaghi2/