Tutto è rivelato

Lezione 13 del corso di Digital Humanities e Data Management per i Beni Culturali (2024/2025)

Sebastian Barzaghi | sebastian.barzaghi2@unibo.it | https://orcid.org/0000-0002-0799-1527 | https://www.unibo.it/sitoweb/sebastian.barzaghi2/

Voyant Tools: attività pratica

Carichiamo un file tratto da Mythologiae

Link al sotto-dataset: https://docs.google.com/spreadsheets/d/1v-H6uYEuJUE_1Jh7SOq4Dyhh6So1tdQU9kN7PuAFFGk/edit?usp=sharing.

  • Su GitHub: tutorial > data > csv > README.md > 4. Dataset Note e Descrizioni > Fonti > Selezione di colonne.

Link a Voyant Tools: https://voyant-tools.org/.

Scaricate il sotto-dataset in CSV, ed effettuate l’upload di questo su Voyant Tools.

1. Parole chiave e frequenze

Scopriamo quali sono le 10 parole più frequenti utilizzate.

  • Di quali dati si tratta?
  • Quale/i visualizzazione/i usereste?
  • Cosa notate (qualsiasi cosa, anche “ovvio” o “banale”)?
  • Ci sono parole che potrebbero essere escluse (cioé aggiunte alla lista di stopwords)? Come cambia l’analisi?

Aggiungere le stopword

Su alcune skin (es. Cirrus), è possibile cliccare sulle opzioni (la terza icona nell’angolo in alto a destra della skin).

Tra le opzioni, abbiamo le stopword. Di default, l’opzione attiva è l’auto-detect (cioé le stopword sono individuate in automatico, sulla base della lingua del testo).

Per modificare manualmente l’elenco di stopword, è sufficiente cliccare su Edit List e aggiungere o togliere parole (ad ogni parola deve corrispondere una riga!).

Una volta salvate e confermate le modifiche, cosa succede?

2. Relazioni tra parole

Scopriamo come le parole sono collegate tra loro in base alla loro co-occorrenza, utilizzando anche le funzioni di ricerca testuale.

  • Di quali dati si tratta?
  • Quale/i visualizzazione/i usereste?
  • Cosa notate (qualsiasi cosa, anche “ovvio” o “banale”)?

Effettuare le ricerche

  • pestilenza: trova il termine esatto;
  • pestilen*: trova termini che iniziano con “pestilen”;
  • "marito e moglie": cerca l’intera espressione;
  • "opera misericordia"~5: “opera” e “misericordia” co-occorrono entro 5 termini;
  • @Personaggi: ricerca raggruppata di tutti i termini inclusi in una categoria;
  • ^@Personaggi: ricerca dei singoli termini inclusi in una categoria.

Aggiungere categorie

Gruppi di parole semanticamente connesse (es. personaggi, luoghi, emozioni) da usare per ricerche mirate.

  • Cliccate su opzioni;
  • Vicino alla voce Categories, cliccate su Edit;
  • Potete rimuovere le categorie esistenti;
  • Cliccate su Add Category;
  • Scrivete un nome per la categoria, e.g. Personaggi e cliccate su Add;
  • Trascinate i nomi dei personaggi dalla lista Terms alla lista Personaggi;
  • Salvare cliccando su Save.

Esplorate!

Cambiate:

  • Opzioni di upload: nella schermata principale, andate su Options > Tables e cambiate il valore di Documents in from cells in each row;
  • Visualizzazioni e le impostazioni per ogni visualizzazione;

Come cambiano i dati? E le visualizzazioni?

Esportate le visualizzazioni

  • Cliccate sull’icona per l’esportazione (la prima in alto a destra nel riquadro della skin);
  • Cliccate su Export Visualization e poi Export a PNG image of this visualization;
  • Sincronizzate, caricate le immagini nel vostro clone della repo, dentro tutorial > doc > img > viz, e fate il pull request.

… E già che ci siamo, ri-allineamo il DMP rispetto a tutto quello che abbiamo fatto fino ad ora!

Fine

Lezione 13 del corso di Digital Humanities e Data Management per i Beni Culturali (2024/2025)

Sebastian Barzaghi | sebastian.barzaghi2@unibo.it | https://orcid.org/0000-0002-0799-1527 | https://www.unibo.it/sitoweb/sebastian.barzaghi2/