Werkbank Geesteswetenschappen

Startpagina > Digitale teksten > Verkrijgbaarheid

Verkrijgbaarheid van gedigitaliseerde teksten

Er worden veel gedigitaliseerde teksten aangeboden die vrij beschikbaar zijn maar het gaat daarbij voornamelijk om ouder materiaal. Dit houdt verband met het feit dat dergelijk materiaal 70 jaar auteursrechtelijk beschermd is. Voor recentere digitale teksten geldt dat ze meestal niet gratis verkrijgbaar zijn en dat er beperkingen gelden m.b.t. hergebruik.

Het is betrekkelijk eenvoudig om gedigitaliseerde tekstmateriaal te vinden: type de titel in het zoekveld van Google of Google Books en de kans op resultaat is groot. De kwaliteit en betrouwbaarheid van hetgeen je vindt is echter vaak niet optimaal, omdat veel materiaal met behulp van OCR-technieken is omgezet naar tekst, zonder (of met gebrekkige) foutcontrole achteraf. Daarnaast is vaak onbekend om welke editie het gaat, terwijl het daarbij toch informatie betreft die voor wetenschappelijk gebruik van een tekst cruciaal is. Controleer daarom altijd goed wat de herkomst is van het materiaal en gebruik uitsluitend teksten waarvan gegevens met betrekking tot de editie bekend zijn. In de weblog Evaluating the quality of electronic texts bespreekt Lisa Spiro een aantal aandachtspunten met betrekking tot de evaluatie van de betrouwbaarheid van gedigitaliserede teksten.

Beter is het om gedigitaliseerde teksten in eerste instantie te zoeken op betrouwbare plaatsen. Dit zijn in de eerste plaats bibliotheken, die in toenemende mate CD-ROM's met gedigitaliseerde literatuur in de collectie opnemen en abonnementen afsluiten voor toegang tot tekstverzamelingen die online worden aangeboden. In de meeste gevallen zijn deze afkomstig van gerenommeerde uitgeverijen. Ook de UB VU biedt diversie verzamelingen gedigitaliserede teksten aan, zie de pagina UB VU van deze Werkbank.

Daarnaast zijn op het internet diverse betrouwbare tekstarchieven te vinden, die vaak worden onderhouden door een wetenschappelijke instelling, bijvoorbeeld omdat ze voortkomen uit een (meestal langlopend) project. Het kan daarbij gaan om archieven die uitsluitend bestaan uit verzamelingen van gedigitaliseerde teksten, of om archieven die ook allerlei extra informatie bieden. Zie voor aantal voorbeelden van belangrijke tesktcollecties de pagina's Collecties Nederland en Colecties buitenland van deze Werkbank.


Logo Delpher     Logo HTA     Logo Perseus    Logo DBNL

Overige pagina's in deze rubriek: Introductie   Typen   Bestandsformaten   Voorbewerking   Annotatie