Werkbank Geesteswetenschappen |
E-tekstIn algemene zin kan een e-tekst (van elektronische tekst; Engels: e-text) worden omschreven als elke vorm van tekstuele informatie die digitaal beschikbaar is in een formaat dat door mensen gelezen kan worden met behulp van de computer. E-teksten worden gecreëerd door bestaande teksten over te typen of te transcriberen (mensenwerk) of door deze te scannen als afbeelding en vervolgens met behulp van optical character recognition (OCR) om te zetten in verwerkbare tekst. OCR werkt het beste met drukwerk van goede kwaliteit (meestal is dat recent drukwerk). In alle gevallen is een correctieronde nodig om een foutloze tekst te verkrijgen. Als deze correctieronde achterwege is gelaten of (semi-)automatisch is uitgevoerd, zal de e-tekst meestal niet foutloos zijn. Als het origineel van een digitaal tekstdocument niet beschikbaar is, is controle van de kwaliteit ervan vaak moeilijk.
E-teksten brengen publicaties die in gedrukte vorm
minder toegankelijk zijn, binnen het bereik van de onderzoeker. Daarnaast is een belangrijke meerwaarde ten opzicht van gedrukte
publicaties de mogelijkheid om de tekst te doorzoeken en te analyseren met behulp van programmatuur voor tekstanalyse.
Kale e-tekstDe meest basale vorm van een e-tekst is een tekstbestand dat uitsluitend een digitale versie van de oorspronkelijke tekst bevat, zonder opmaak, verschillende lettertypen, links, afbeeldingen, etc. Dergelijke bestanden bestaan uitsluitend uit letters, cijfers en leestekens (zgn. ASCII-karakters) en bevatten geen vormen van codering. Meestal is de complete tekst opgenomen in één bestand. Hierdoor vormen ze een goede basis voor diverse vormen van computerondersteunde tekstanalyse, omdat ze op allerlei manieren kunnen worden doorzocht en bewerkt. Kale e-teksten zijn meestal minder geschikt voor lezen van de tekst vanaf het beeldscherm. Bovendien is een boek meer dan alleen een tekst; waar het de presentatie betreft, schieten dergelijke e-teksten tekort.Voorbeelden:
Geannoteerde e-tekstEen geannoteerde e-tekst is een 'kale' e-tekst waaraan ten behoeve van onderzoek diverse coderingen zijn toegevoegd. Het kan daarbij bijvoorbeeld gaan om broncodes, structuurcodes of inhoudelijke codes. In de meeste gevallen gaat het hierbij nog steeds om tekst die uitsluitend bestaat uit ASCII-karakters. Dergelijke e-teksten zijn vooral geschikt voor computerondersteunde tekstanalyse (hoewel dit uiteraard samenhangt met het type annotatie dat de tekst bevat). De nadelen die zijn genoemd bij kale e-teksten, gelden hier echter nog sterker.Voorbeelden:
Hoewel een groeiend aantal e-teksten bron- en structuurannotaties bevat, zijn er weinig inhoudelijk geannoteerde e-teksten beschikbaar. Deze vorm van annotatie wordt meestal door onderzoekers toegevoegd aan hun eigen onderzoekskopie van de betreffende e-tekst(en). Zie ook de pagina over formele annotatie.
Opgemaakte e-tekstSteeds vaker worden e-teksten aangeboden die een bepaalde vorm van opmaak bevatten. Hoewel dergelijke bestanden ook wel voorkomen in Word- of pdf-formaat, gaat het meestal om HTML-bestanden die gelezen worden met behulp van een web browser. Hoewel de tekst door de opmaak meestal goed leesbaar is vanaf het beeldscherm, gaat het meestal toch niet om een exacte kopie van het origineel. Zeker als het om oudere drukken gaat, is daarvoor echt een (digitaal) facsimile nodig. In één tekstarchief worden alle teksten vaak ook op uniforme wijze gepresenteerd.Dergelijke e-teksten moeten meestal eerst bewerkt worden voordat ze gebruikt kunnen worden voor computerondersteunde tekstanalyse. Zo is het vaak gewenst dat de HTML-codering en eventuele scripting code uit de tekst wordt verwijderd. Bovendien zijn dergelijke teksten vaak opgedeeld in deelbestanden (bijvoorbeeld één voor elk hoofdstuk van een boek), waardoor ze minder goed doorzoekbaar zijn, behalve als de website waarop de bestanden worden aangeboden een overkoepelende zoekfunctie biedt. Als er sprake is van een dergelijke opdeling in deelbestanden, is het ook bewerkelijker om deze e-teksten te downloaden voor analyse met eigen programmatuur. Voorbeelden:
|
Overige pagina's in deze rubriek: Digitaal facsimile E-tekst PLUS Kritische editie E-books en luisterboeken |