
L'eXtensive Markup Language (XML) è un metalinguaggio: un linguaggio usato per descrivere altri linguaggi (di marcatura).
Permette di specificare come la marcatura viene distinta dal testo, quale marcatura è permessa e quale è obbligatoria.
Basato su elementi e attributi.


Devi sempre chiudere l’utlimo tag che hai aperto prima di chiuderne un altro precedente.
Per esempio, questo è un errore:
<sentence>Questo è <emphasis>un errore!</sentence></emphasis>
Questo, invece, è corretto:
<sentence>Questo non è <emphasis>un errore!</emphasis></sentence>
Possono essere scritti normalmente:
<milestone type="pagebreak"></milestone>
Oppure con solo il tag di apertura e il secondo caporale > preceduto da /:
<milestone type="pagebreak"/>
Esempio:<?xml version="1.0" encoding="UTF-8"?>
Dichiara i dettagli del file (in questo caso, è un documento XML, versione 1.0, e codificato secondo UTF-8).
Ci possono essere altre informazioni, come la lingua, lo stile, ecc.
Un modello basato su XML per marcare testi umanistici.
Standard internazionale che dà ampie libertà di codificare le caratteristiche del testo secondo diverse soluzioni. Definisce circa 580 elementi e 265 attributi per rappresentare un insieme molto ampio di fenomeni testuali e meta-informazioni ad essi associate.
Pochissimi progetti richiedono una conoscenza completa di TEI. Per questo, è stato publbicato anche un sottoinsieme gestibile con gli elementi fondamentali, chiamato TEI Lite.
Tra i moduli più utilizzati, troviamo:
tei: definisce le basi infrastrutturali su cui si appoggiano elementi ed attributi degli altri moduli;header: definisce gli elementi che compongono la sezione dell’intestazione (es. metadati bibliografici, relazioni con i materiali di orgine, revisioni, ecc.);core: definisce elementi ed attributi che possono far parte di qualsiasi documento (es. paragrafi, citazioni, liste, entità, note, elementi grafici, ecc.);textstructure: definisce elementi ed attributi che descrivono la struttura dei testi (es. pagine, corpo del testo, intestazioni, postfazioni, ecc.).Per usare efficacemente TEI, dovete assicurarvi che:
Servizio per la creazione di schemi TEI documentati: https://roma.tei-c.org/.
TEI, in cui viene sempre dichiarato un attributo @xmlns con il valore http://www.tei-c.org/ns/1.0;<TEI xmlns="http://www.tei-c.org/ns/1.0">
...
</TEI>
TEI, contenente:teiHeader, per i metadati<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
...
</teiHeader>
...
</TEI>
TEI, contenente:teiHeader, per i metadatitext, per il contenuto effettivo del documento<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
...
</teiHeader>
<text>
...
</text>
...
</TEI>
Contiene almeno una descrizione del documento digitale, dentro l’elemento fileDesc.
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
<fileDesc>
...
</fileDesc>
</teiHeader>
<text>
...
</text>
...
</TEI>
fileDesc deve contenere almeno questi elementi:
titleStmt, contenente informazioni su titolo (title) e responsabilità;<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
<fileDesc>
<titleStmt>
<title>
...
</title>
</titleStmt>
</fileDesc>
</teiHeader>
<text>
...
</text>
...
</TEI>
fileDesc deve contenere almeno questi elementi:
titleStmt, contenente informazioni su titolo (title) e responsabilità;publicationStmt, contenente informazioni sulla pubblicazione;<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
<fileDesc>
<titleStmt>
<title>
...
</title>
</titleStmt>
<publicationStmt>
...
</publicationStmt>
</fileDesc>
</teiHeader>
<text>
...
</text>
...
</TEI>
fileDesc deve contenere almeno questi elementi:
titleStmt, contenente informazioni su titolo (title) e responsabilità;publicationStmt, contenente informazioni sulla pubblicazione;sourceDesc, contenente informazioni sulla fonte materiale del testo.<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
<fileDesc>
<titleStmt>
<title>
...
</title>
</titleStmt>
<publicationStmt>
...
</publicationStmt>
<sourceDesc>
...
</sourceDesc>
</fileDesc>
</teiHeader>
<text>
...
</text>
...
</TEI>
Il testo text contiene almeno un corpo (body).
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
<fileDesc>
<titleStmt>
<title>
...
</title>
</titleStmt>
<publicationStmt>
...
</publicationStmt>
<sourceDesc>
...
</sourceDesc>
</fileDesc>
</teiHeader>
<text>
<body>
...
</body>
</text>
...
</TEI>
Il testo text contiene almeno un corpo (body).
body contiene strutture testuali, come paragrafi (p) e altri costrutti, compreso uno generico div.
<TEI xmlns="http://www.tei-c.org/ns/1.0">
<teiHeader>
<fileDesc>
<titleStmt>
<title>
...
</title>
</titleStmt>
<publicationStmt>
...
</publicationStmt>
<sourceDesc>
...
</sourceDesc>
</fileDesc>
</teiHeader>
<text>
<body>
<p>
...
</p>
</body>
</text>
...
</TEI>
div, p, list, item, ecc.;hi;emph, foreign, quote, term, gloss, title, name, num, measure, date, address, abbr, ecc.;note, sic, corr, choice, orig, reg, gap, ecc.Elemento ref con i possibili attributi:
type: tipo del riferimento;target: oggetto del riferimento, nella forma di un link o di un URI.Si può utilizzare anche name per i nomi propri, o rs per i nomi comuni, oppure altri elementi più specifici (es. persName, orgName, ecc.).
Esempio:
<ref type=“person” target=“https://www.wikidata.org/wiki/Q5582">Van Gogh</ref>, uno dei più grandi pittori di tutti i tempi.
date con questi possibili attributi:@calendar: sistema di calendario (es. “gregorian”);@when: valore della data in formato standard (es. “2009-12-31”);@from e @to: inizio e fine definiti della data;@notBefore e @notAfter: inizio e fine non definiti della data.Esempi:
num con questi possibili attributi:@type: tipo di valore numerico (es. “cardinal”, “percentage”, “ordinal”, ecc.);@value: valore numerico in formato standard.measure con questi possibili attributi:@type: tipo di misura (es. “volume”, “width”, “length”, ecc.);@quantity: quantità espressa dalla misura in formato standard;@unit: unità di misura (es. “litre”, “kilogram”, ecc.).Esempio:
Van Gogh, uno dei più grandi pittori di tutti i tempi, lavorò per <num type=“cardinal” value=“2”>due</num>` anni a Tilburg.
@xml:id: identificatore univoco dell’elemento (es. <ref xml:id=“ref-1” type=“person” target=“https://www.wikidata.org/wiki/Q5582">Van Gogh</ref>);@n: identificatore non univoco dell’elemento (es. <ref xml:id=“ref-1” n=“1” type=“person” target=“https://www.wikidata.org/wiki/Q5582">Van Gogh</ref>);@xml:lang: lingua del contenuto dell’elemento (es. <date xml:lang=“it” from=“1866” to=“1868”>due anni</date>);@cert: certezza del codificatore sull’interpretazione rappresentata dall’elemento (es. <date xml:lang=“it” cert=“high” from=“1866” to=“1868”>due anni</date>);@resp: persona o organizzazione considerata responsabile della marcatura (es. <date xml:lang=“it” from=“1866” to=“1868” resp="#SB”>due anni</date>)Ci sono solo due modi per capire bene come funziona TEI (ma questo in realtà vale per tutto quello che stiamo facendo):
Tra queste colonne, c’è cho_note, che contiene informazioni descrittive e contestuali di ogni opera.
Esempio:
Olio su tela. Moreau lasciò il segno con questo dipinto al Salon di Parigi del 1864. Nonostante la crescente importanza delle raffigurazioni della vita quotidiana, ha ritratto storie tratte dalla Bibbia, dalla mitologia e dalla sua immaginazione. Il suo immaginario ultraterreno ha ispirato molti artisti e scrittori più giovani, tra cui Odilon Redon e Oscar Wilde.
body del template;[ID].xml, dove ID è il numero di identificazione dell’opera nel sotto-dataset), poi caricatela nella cartella tei in data, sincronizzate la copia alla repo originale, e fate un pull request.Vogliamo marcare:
ref con@type con i possibili valori “person”, “character”, “place”, “event”, “work”, “organization”, “collection”;@target con valore l’URI alla rispettiva voce su Wikidata, se esiste.date con@when;@from e @to, oppure @notBefore e @notAfter.measure con@type@quantity@unitRicordatevi di modificare anche le parti di testo presenti nel teiHeader scritte in maiuscolo e racchiuse in parentesi quadre.
Se volete provare a marcare anche altro, fate pure!