Link al sotto-dataset: https://docs.google.com/spreadsheets/d/1v-H6uYEuJUE_1Jh7SOq4Dyhh6So1tdQU9kN7PuAFFGk/edit?usp=sharing.
tutorial > data > csv > README.md > 4. Dataset Note e Descrizioni > Fonti > Selezione di colonne.Link a Voyant Tools: https://voyant-tools.org/.
Scaricate il sotto-dataset in CSV, ed effettuate l’upload di questo su Voyant Tools.
Scopriamo quali sono le 10 parole più frequenti utilizzate.
Su alcune skin (es. Cirrus), è possibile cliccare sulle opzioni (la terza icona nell’angolo in alto a destra della skin).
Tra le opzioni, abbiamo le stopword. Di default, l’opzione attiva è l’auto-detect (cioé le stopword sono individuate in automatico, sulla base della lingua del testo).
Per modificare manualmente l’elenco di stopword, è sufficiente cliccare su Edit List e aggiungere o togliere parole (ad ogni parola deve corrispondere una riga!).
Una volta salvate e confermate le modifiche, cosa succede?
Scopriamo come le parole sono collegate tra loro in base alla loro co-occorrenza, utilizzando anche le funzioni di ricerca testuale.
pestilenza: trova il termine esatto;pestilen*: trova termini che iniziano con “pestilen”;"marito e moglie": cerca l’intera espressione;"opera misericordia"~5: “opera” e “misericordia” co-occorrono
entro 5 termini;@Personaggi: ricerca raggruppata di tutti i termini inclusi in una
categoria;^@Personaggi: ricerca dei singoli termini inclusi in una categoria.Gruppi di parole semanticamente connesse (es. personaggi, luoghi, emozioni) da usare per ricerche mirate.
Cambiate:
from cells in each row;Come cambiano i dati? E le visualizzazioni?
tutorial > doc > img > viz, e fate il pull request.