Dati e modelli per il patrimonio culturale e la loro rappresentazione

I casi del Rinascimento digitale di Ulisse Aldrovandi e del Progetto SIRIUS

Sebastian Barzaghi | https://www.unibo.it/sitoweb/sebastian.barzaghi2/ | sebastian.barzaghi2@unibo.it | https://orcid.org/0000-0002-0799-1527

Outline

  1. Concetti chiave
  • Dato
  • Modello (di dati)
  • FAIRness
  1. Casi di studio
  • Aldrovandi (Spoke 4)
  • SIRIUS (Spoke 6)

Partiamo dai dati

Si parte sempre dai dati

Fonte: Noppe, N., Vanvelk, J., & Callens, N. (2023). The hands-on guide to research data management for KU Leuven researchers, students, and research support staff in the humanities and social sciences. Zenodo. https://doi.org/10.5281/zenodo.8010618.

I dati sono record fattuali raccolti, generati o riutilizzati come base di analisi, ragionamenti, discussioni o calcoli.

Fare ricerca implica lavorare con i dati, tanto come oggetti di studio ed analisi, quanto come prodotti del processo stesso di ricerca.

Le sfide dei dati culturali

I processi della ricerca in ambito culturale sono ancora dominati da paradigmi tradizionali.

I dati culturali sono complessi e raramente documentati in modo da facilitarne l'integrazione, la comprensione e il riutilizzo da parte di altri.

Semplifichiamo

I dati sono rappresentati da modelli

Fonte: Kučerová, H. (2018). The concept of model and conceptual model in information science. https://knihovnarevue-en.nkp.cz/archives/2018-2/reviewed-articles/the-concept-of-model-and-conceptual-model-in-information-science.

Astrazioni che descrivono i dati per renderli comprensibili a umani e macchine.

Dati e modelli devono parlare

Un modello deve rappresentare una visione chiara e condivisa del significato dei dati.

I dati rappresentati da modelli uguali (o formalmente allineati) parlano la stessa lingua.

Questa rappresentazione è fondamentale per l'apertura dei dati.

Apriti, Scienza

La scienza fatta bene

MBezjak, S., Clyburne-Sherin, A., Conzett, P., Fernandes, P. L., Görögh, E., Helbig, K., ... & Tennant, J. (2018). The Open Science Training Handbook. https://open-science-training-handbook.gitbook.io/book.

La Scienza Aperta è un insieme di movimenti e pratiche che ha l'obiettivo di rendere la conoscenza scientifica più trasparente, accessibile e riutilizzabile per tutti.

La FAIRificazione

Processo di trasformazione di dati non-FAIR in una loro versione FAIR.

Include la definizione di un modello semantico e la sua applicazione per collegare i dati tra loro.

Per fare questo, si utilizzano tecnologie legate al paradigma dei Linked Open Data.

Dati aperti e contestualizzati

Fonte: Bernard, C. (2019). Immersing evolving geographic divisions in the semantic Web (Doctoral dissertation, Université Grenoble Alpes). https://theses.hal.science/tel-02524361v1.

I Linked Open Data (LOD) sono dati semi-strutturati, pubblicati in formato aperto e descritti tramite modelli semantici.

Sono rappresentati tramite triple soggetto-predicato-oggetto su cui si basa RDF (Resource Description Framework).

I nostri due casi di FAIRificazione

Fonte: Peroni, S. (2016). SAMOD: an agile methodology for the development of ontologies. figshare. http://dx.doi.org/10.6084/m9.figshare.3189769.

La digitalizzazione di una mostra temporanea, e la valorizzazione di dati di valutazione dei rischi in ambito culturale.

Definizione, sviluppo e implementazione di un modello semantico che "FAIRifica" i dati esistenti.

Caso 1: Il Rinascimento Digitale di Ulisse Aldrovandi

Digitalizzare una mostra temporanea

Fonte: Balzani, R., Barzaghi, S., Bitelli, G., Bonifazi, F., Bordignon, A., Cipriani, L., ... & Vittuari, L. (2024). Saving temporary exhibitions in virtual environments: The Digital Renaissance of Ulisse Aldrovandi–Acquisition and digitisation of cultural heritage objects. Digital Applications in Archaeology and Cultural Heritage, 32, e00309. https://doi.org/10.1016/j.daach.2023.e00309.

Progetto pilota per raccogliere linee guida di acquisizione e digitalizzazione del patrimonio culturale, da applicare ai casi core dello Spoke 4.

I dati: oggetti culturali

Fonte: Barzaghi, S., Bordignon, A., Gualandi, B., & Peroni, S. (2024, June 5). Thinking Outside the Black Box: Insights from a Digital Exhibition in the Humanities. MeTe digitali. Mediterraneo in rete tra testi e contesti (AIUCD 2024), Catania, Italy. Zenodo. https://doi.org/10.5281/zenodo.11487997.

Descrizione strutturata per ogni oggetto, definita da una serie di metadati bibliografici estratti dal catalogo del museo.

I dati: processo di digitalizzazione

Fonte: Barzaghi, S., Bordignon, A., Gualandi, B., Heibi, I., Massari, A., Moretti, A., ... & Renda, G. (2024). A Proposal for a FAIR Management of 3D Data in Cultural Heritage: The Aldrovandi Digital Twin Case. arXiv preprint arXiv:2407.02018. https://doi.org/10.48550/arXiv.2407.02018.

Descrizione strutturata per il processo di digitalizzazione di ogni oggetto, definita da una serie di metadati assegnati ad ogni fase prevista dal flusso di lavoro.

Il modello: CHAD-AP

Fonte: Barzaghi, S., Heibi, I., Moretti, A., & Peroni, S. (2024). Developing Application Profiles for Enhancing Data and Workflows in Cultural Heritage Digitisation Processes. arXiv preprint arXiv:2404.12069. https://doi.org/10.48550/arXiv.2404.12069.

Il modello: CHAD-AP

Fonte: Barzaghi, S., Heibi, I., Moretti, A., & Peroni, S. (2024). Developing Application Profiles for Enhancing Data and Workflows in Cultural Heritage Digitisation Processes. arXiv preprint arXiv:2404.12069. https://doi.org/10.48550/arXiv.2404.12069.

Esempio

Esempio

Esempio

Esempio

Esempio

Esempio

Esempio

Esempio

Esempio

Esempio

Esempio

Esempio

Esempio

Risultati

Un profilo applicativo totalmente documentato, estendibile, allineato a standard internazionali, e pubblicamente disponibile, per rappresentare oggetti culturali e il loro processo di digitalizzazione.

Opportunità: trattamento dei modelli 3D come veri e propri dati della ricerca.

Caso 2: SIRIUS

Promuovere una cultura del rischio

Fonte: Fiorentino, S., Chinni, T., Cornaglia, M., Iannucci, A., Vandini, M. (2024). From data interrelationships to capacity building and public awareness: the instance of Ravenna (Italy) and project SIRIUS - management strategies for cultural heritage at risk. PROCULTHER-NET 2 Project. Technical Bulletin N. 3, pp 18-27. https://civil-protection-knowledge-network.europa.eu/system/files/2024-07/tb_3_final.pdf.

Progetto che punta all'implementazione su scala locale di linee guida internazionali per la prevenzione di rischi ambientali e antropici che impattano sul patrimonio culturale.

I dati: assessment del rischio

Fonte: WARREDOC. (2022). Study on risk assessment and management of cultural heritage across Europe: Risk Management for Cultural Heritage (Agreement n° 2021-1-IT01-KA220-VET-000034797, Project Result N.1). RMCH Steering Committee. https://www.charisma-academy.eu/wp-content/uploads/2022/11/CHARISMA_PR1_Study-on-risk-assessment-and-management-of-cultural-heritage-across-Europe.docx.pdf.

Processo scientifico complesso che coinvolge svariate attività di raccolta, analisi, valutazione e produzione di dati, spesso sparsi e non strutturati.

Il modello: HeRO

Fonte: Barzaghi, S. (2024). Towards a FAIR Ontology Pattern for Describing Heritage Risk Assessment Activities. In: Antonacopoulos, A., et al. Linking Theory and Practice of Digital Libraries. TPDL 2024. Lecture Notes in Computer Science, vol 15178. Springer, Cham. https://doi.org/10.1007/978-3-031-72440-4_15.

Esempio

Durante un'attività di identificazione dei rischi relativi al Battistero degli Ariani, condotta a Ravenna da Laura Rossi tra l'1 marzo e l'1 aprile 2024, viene identificato quanto segue: "Inondazioni e piogge forti, di cadenza annuale, posso causare l'erosione delle mura del battistero".

Esempio

Durante un'attività di identificazione dei rischi relativi al Battistero degli Ariani, condotta a Ravenna da Laura Rossi tra l'1 marzo e l'1 aprile 2024, viene identificato quanto segue: "Inondazioni e piogge forti, di cadenza annuale, posso causare l'erosione delle mura del battistero".

Esempio

Durante un'attività di analisi dei rischi che interessano il Battistero degli Ariani, condotta tra l'1 aprile e l'1 maggio, Laura individua quanto segue: "Un evento di alluvione è previsto nel battistero circa una volta ogni 25 anni, colpendo molto probabilmente l'intero valore del patrimonio per evento, con conseguente perdita parziale". Per trarre queste conclusioni, Laura usa come fonte il dataset "dati_alluvione_2011-2016.zip", e assegna una serie di punteggi che determinano il calcolo del rischio.

Esempio

Durante un'attività di analisi dei rischi che interessano il Battistero degli Ariani, condotta tra l'1 aprile e l'1 maggio, Laura individua quanto segue: "Un evento di alluvione è previsto nel battistero circa una volta ogni 25 anni, colpendo molto probabilmente l'intero valore del patrimonio per evento, con conseguente perdita parziale". Per trarre queste conclusioni, Laura usa come fonte il dataset "dati_alluvione_2011-2016.zip", e assegna una serie di punteggi che determinano il calcolo del rischio.

Risultati

Un design pattern facilmente integrabile, estendibile, documentato su GitHub e archiviato ad ogni update su Zenodo, per rappresentare le attività coivolte nella valutazione dei rischi a cui sono soggetti i beni culturali.

Opportunità: pubblicazione di dati sparsi e ricchi di complessità e un loro riutilizzo per un impatto potenzialmente più significativo sulla comunità.

Nel prossimo futuro

Fonte: Barzaghi, S. (2024). sirius-org/risk-atlas: Version 0.1.0 (v0.1.0). Zenodo. https://doi.org/10.5281/zenodo.13857449.

Al momento stiamo sviluppando un'applicazione Web per la visualizzazione interattiva dei dati e il monitoraggio di eventi di rischio.

Un'altra attività riguarderà lo sviluppo di (almeno) un vocabolario controllato per definire una "terminologia del rischio" per i beni culturali.

Per concludere

Dati + modelli + FAIRness = buona rappresentazione

Una rappresentazione FAIR dei dati attraverso modelli semantici adeguati è essenziale per una gestione scientifica del patrimonio culturale.

Se ben concertato, questo approccio ha impatti significativi non solo sulla ricerca, ma anche sull'industria e sulla cittadinanza.

Rendiamo i nostri dati più aperti e FAIR

I modelli semantici non solo facilitano la comunicazione tra diversi dati e servizi, ma sono anche essenziali per documentarli e renderli più comprensibili.

Metadati e documentazione relativi ai processi e alle metodologie devono essere raccolti e valorizzati, soprattutto durante lo svolgimento del progetto.

Le metodologie sono dati, quindi trattiamole come tali: come facciamo le cose è importante tanto quanto (o più de)le cose che facciamo!

Facciamoci le domande giuste

Nella nostra ricerca, integriamo pratiche di Open Science per assicurare l'interoperabilità e il riutilizzo dei dati? Quali? Come?

Che tipo di dati e di metodologie utilizziamo? Quanto sono FAIR?

Con quali modelli li rappresentiamo? Sono comprensibili?

Cosa altro ci serve per contribuire ad una base di conoscenza del nostro patrimonio culturale più aperta e condivisa?

Grazie!

Dati e modelli per il patrimonio culturale e la loro rappresentazione

I casi del Rinascimento digitale di Ulisse Aldrovandi e del Progetto SIRIUS

Sebastian Barzaghi | https://www.unibo.it/sitoweb/sebastian.barzaghi2/ | sebastian.barzaghi2@unibo.it | https://orcid.org/0000-0002-0799-1527