Werkbank Geesteswetenschappen

Startpagina > Tekstanalyse > Lexicale analyse

Lexicale analyse

Met lexicale analyse wordt gedoeld op tekstuele analyse die uitgaat van het voorkomen en het gebruik van bepaalde woorden in de te analyseren brontekst(en). Het kan daarbij gaan om de frequentie van woorden in een tekst (bijvoorbeeld bij contrastieve analyses), maar meestal gaat het om het zoeken naar bepaalde woorden of woordcombinaties, woordpatronen en eventuele annotaties in een tekst. Ook andere woordgerelateerde aspecten, zoals de distributie van bepaalde woorden in een tekst en het vaststellen van tekstspecifiek vocabulaire maken deel uit van deze analysemethode.
Tekstanalyse Al sinds de jaren '60-'70 van de vorige eeuw wordt onderzocht hoe de computer kan worden ingezet ter ondersteuning van dergelijke analyse. In de wetenschappelijke literatuur zijn hiervan diverse voorbeelden te vinden, op het gebied van thematische, stilistische en structurele analyse, intertekstualiteit en prosodische analyse (rijm en metrum). Een uitgebreid overzicht hiervan is te vinden in hoofdstuk 5 ("Literary Analysis") van het boek Electronic Texts in the Humanities, door Susan Hockey (Oxford: OUP, 2000).

Een veel gebruikt hulpmiddel bij lexicale tekstanalyse is een concordantieprogramma. Hiermee kan snel en efficiënt worden onderzocht hoe bepaalde woorden worden gebruikt in een tekst of een verzameling teksten: in welke context komen ze voor, met welke andere woorden worden ze gecombineerd, waar in de tekst komen ze voor, etc. Dergelijke programmatuur biedt dus de mogelijkheid om op een andere manier een tekst te benaderen dan met behulp van (lineair) lezen mogelijk is. Daarbij biedt het (veel) meer specifieke mogelijkheden voor tekstuele analyse dan een programma als Word. Ook teksten die via het internet worden aangeboden, zijn vaak beperkt doorzoekbaar: je kunt in principe alleen doen wat de maker van de website voor je heeft bedacht (of zoeken binnen ze webpagina met de standaardzoekfunctie van de web browser). Meer uitgebreide analyses zijn meestal niet mogelijk.

Bij thematische analyse is meestal niet van tevoren duidelijk naar welke woorden precies moet worden gezocht. De volgende werkwijzen zijn dan mogelijk:

  • Potentieel relevante woorden opzoeken in een frequentielijst; vervolgens van deze woorden concordantie opvragen (zie: concordantie).
  • De relevante woorden (handmatig) in de tekst voorzien van codes.
  • Werken met semantisch georiënteerde zoekprogrammatuur (zie: text mining). Deze techniek is momenteel nog volop in ontwikkeling.

Het werken vanuit een frequentielijst is (veel) minder arbeidsintensief dan het annoteren van een tekst. Bovendien is het daarbij mogelijk om tamelijk intuïtief te werk te gaan en ben je wat flexibeler dan met een annotatie (die meestal éénmaal wordt aangebracht en vervolgens niet snel meer zal worden aangepast, waardoor hij de analyse teveel zou kunnen gaan sturen). Een nadeel ten opzichte van annotatie is dat woorden vaak homoniemen hebben die niet interessant zijn voor je onderzoek, en die je dus uit de concordantie moet filteren. Bovendien zijn niet alle concepten, thematische aspecten, e.d., in specifieke woorden te vatten. Een bepaald thema kan heel goed worden gerepresenteerd door woorden die je daar in eerste instantie niet mee zou associëren.

N.B. Om dergelijke programma's te kunnen gebruiken, is het meestal nodig om de te analyseren tekst(en) in een bepaalde mate voor te bewerken. Dit hangt mede samen met het formaat waarin het bestand is opgeslagen (zie: bestandsformaten en voorbewerking). Daarnaast is het soms nuttig of nodig om de tekst te verrijken met bepaalde structurele of analytische informatie (zie: formele annotatie).

Overige pagina's in deze rubriek: Introductie   Kwalitatieve analyse   Inhoudsanalyse   Text mining   Stylometrie