Werkbank Geesteswetenschappen

Startpagina > Digitale teksten > Introductie

Gedigitaliseerde tekstbestanden

In veel onderzoek binnen de geesteswetenschappen staat de inhoudelijke analyse van teksten centraal. Steeds meer literaire teksten, brieven, pamfletten, tractaten, parlementsverslagen en andere historische teksten die in eerste instantie alleen op papier beschikbaar waren, zijn tegenwoordig in gedigitaliseerde vorm beschikbaar, of kunnen door de onderzoeker worden gedigitaliseerd. Dat kan verschillende voordelen hebben:

  • Beschikbaarheid: kwetsbare, zeldzame en/of obscure teksten komen in gedigitaliseerde vorm binnen het bereik van onderzoekers in de hele wereld. Het feit dat te bestuderen werken uitsluitend in andere landen beschikbaar zijn en/of zijn verspreid over meerdere lokaties wordt steeds minder een probleem.
  • Doorzoekbaarheid en mogelijkheden voor analyse: bepaalde vormen van gedigitaliseerde teksten zijn op verschillende manieren doorzoekbaar en lenen zich voor diverse vormen van computerondersteunde tekstanalyse, zoals die elders in deze Werkbank worden behandeld.
  • Speciale publicatievormen: gedigitaliseerde teksten kunnen, bijvoorbeeld met behulp van HTML, op manieren worden gepubliceerd die in traditionele drukvorm niet mogelijk zijn. Naast de oorspronkelijke tekst kunnen daardoor ook bijvoorbeeld varianten, een transcript, een vertaling of een hertaling, een notenapparaat op verschillende wijzen raadpleegbaar zijn. Met name voor het bestuderen van teksten kan dat bepaalde voordelen bieden. 

In deze rubriek wordt een beknopt overzicht gegeven van de verschillende typen gedigitaliseerde tekstbestanden die bestaan (en die allemaal hun eigen toepassingsmogelijkheden hebben), de wijze waarop deze kunnen zijn opgeslagen (het zgn. bestandsformaat, dat in belangrijke mate bepaalt wat je met een digitaal tekstbestand kunt doen en hoe je dat kunt/moet doen) en wordt aandacht besteed aan de verkrijgbaarheid van dergelijke bestanden.

Meer informatie over digitale tekstbestanden kun je vinden in:

Willett, Perry. "Electronic Texts: Audiences and Purposes". Chapter 18 of A Companion to Digital Humanities. Ed. Susan Schreibman, Ray Siemens and John Unsworth. Oxford, Blackwell, 2004. http://www.digitalhumanities.org/companion/

Overige pagina's in deze rubriek: Typen   Bestandsformaten   Voorbewerking   Annotatie   Verkrijgbaarheid