Werkbank Geesteswetenschappen

Startpagina > XML > Voorbeelden

Voorbeelden van het gebruik van XML

XML (en zijn voorloper SGML) kan worden gebruikt voor de structurele en inhoudelijke annotatie van gedigitaliseerde teksten. Dat wordt zowel ingezet voor de bezorging en publicatie van teksten als voor de analyse daarvan. In veel gevallen gaat het daarbij om XML-coderingen zoals die zijn gedefinieerd door het Text Encoding Initiative.

  • Jane Austen's roman The Watsons
    Voorbeeld van een romantekst met eenvoudige structuurmarkering (paragrafen, het element <p>) en een markering van benadrukte woorden (het element <hi>). Tevens bevat dit document een zgn. TEI-header, waarin allerlei metadata met betrekking tot de roman is opgenomen.
  • Shake-speares Sonnets
    Voorbeeld van een document waarin de structuur van een toneelstuk is geannoteerd.
    N.B. Het gaat hier om een SGML-document (SGML is de voorloper van XML).
  • Het TEI By Example project van de KANTL geeft een mooi overzicht van de toepassingsmogelijkheden van XML bij de annotatie van poëzie en is voorzien van veel voorbeelden.
  • In toenemende mate wordt XML gebruikt voor de structurele en inhoudelijke annotatie van tekstcorpora ten behoeve van taalkundig onderzoek, die uitgebreide exploratie en analyse van het materiaal mogelijk maken. In veel gevallen gaat het daarbij om XML-coderingen zoals die zijn gedefinieerd door het Text Encoding Initiative. Voorbeelden van taalkundige XML-codering.
  • Voorbeeld van een gedigitaliseerde historische inventaris in EAD (een toepassing van XML).

Projecten

In een groeiend aantal (onderzoeks)projecten binnen de geesteswetenschappen speelt XML (of zijn voorloper SGML) een belangrijke rol. Uitgangspunt daarbij is vaak de dtd van het Text Encoding Initiative, of een aangepaste versie daarvan. Voorbeelden:
  • American Verse Project: an electronic archive of volumes of American poetry prior to 1920. The full text of each volume of poetry is being converted into digital form and coded in Standard Generalized Mark-up Language (SGML) using the TEI Guidelines, with various forms of access provided through the internet.
  • Victorian Women Writers Project: highly accurate transcriptions of works by British women writers of the 19th century (presented via a web interface), encoded using XML.
  • Der junge Goethe in seiner Zeit: a new edition of Goethe's early works, combined with a large selection of works by others, enabling one to view Goethe's work in its historical and literary context. The digital texts are made available in FolioView and also encoded in SGML, following the TEI guidelines.
  • The Digital Locke Project: a pilot project that makes a start with a scholarly text edition of the manuscripts of the British philosopher John Locke (1632-1704) in the form of an XML-encoded database that is used simultaneously for an online version and the printed version of the manuscripts. The TEI dtd formed the basis for this project.
  • Emblem Project Utrecht: digitization of Dutch 17th-century emblem books, religious as well as profane, combining full transcriptions, page facsimiles and indexes, as well as extented search options. The books have been encoded using TEI/XML.
  • Newcastle Electronic Corpus of Tyneside English: a corpus of dialect speech from Tyneside in North-East England. The corpus is coded with XML, based on the TEI dtd.
  • Voices of the Holocaust: an online collection of interviews with Holocaust survivors conducted in the immediate aftermath of World War II. TEI encoding is used to provide a structured data model for the transcriptions, which allows various manifestations of the interviews (text, audio)--as well as other types of content (metadata, GIS, scholarly criticism)--to be integrated into a dynamic, robust presentation for the user.