Concordantie
Een concordantie is een alfabetische lijst van de woorden in een document of verzameling documenten, met hun directe context. Het maken van concordanties is een taak die computers uitstekend kunnen uitvoeren. De huidige concordantieprogramma's bieden een scala aan mogelijkheden, waarvan de onderstaande het meest voorkomend zijn.
N.B. In het
onderstaande kan voor 'tekst' ook gelezen worden
'verzameling teksten'.
- De productie van van frequentielijsten en concordanties
Een frequentielijst
is een woordenlijst waarin bij elk woord de frequentie ervan in de
tekst wordt aangegeven. Meestal kunnen dergelijke overzichten op
verschillende manieren worden gepresenteerd: oplopend of aflopend op
frequentie, alfabetisch of als
retrograde woordenlijst.
Een concordantie
is een overzicht van alle woorden in een tekst, of van een bepaalde
selectie van woorden, waarbij van elk woord naast de vindplaats ook de
context wordt getoond waarin het woord voorkomt. Meestal kan de
gewenste omvang van de context worden ingesteld door de gebruiker en kan
de concordantie worden geordend op rechter en/of linker context. Voorbeeld van een concordantie van de woordvormen grow, grew en grown in de roman Alice in Wonderland, geordend op rechter context.
- Het zoeken naar woorden en woordgroepen
Er kan op verschillende manieren worden gezocht naar woorden of
woordgroepen die in een tekst voorkomen. Hierbij kan vaak gebruik
worden gemaakt van zgn. wildcards
die het mogelijk maken om te zoeken naar woorden die beginnen of
eindigen met bepaalde letters (b.v. alle woorden die beginnen met liefde of eindigen
op heid).
Tevens kunnen combinaties met bepaalde andere woorden worden vereist of
juist worden uitgesloten en kan worden aangegeven dat men is
geïnteresseerd in meerdere woorden (alternantie: 'woord A' of
'woord B' of 'woord C'). De uitvoer van de zoekopdracht wordt meestal
getoond in de vorm van een een concordantie.
- Het plotten van woorden
Hiermee wordt een grafisch overzicht verkregen van de plaatsen waar een
woord of een reeks woorden voorkomt in de tekst. Dit toont dus de
spreiding (distributie) van woorden in een tekst.
- Het analyseren van woordcombinaties
Hieronder wordt verstaan dat de programmatuur analyseert met welke
andere woorden een bepaald woord vooral wordt gecombineerd. Dit kan
gaan om het simpel tellen van veelvoorkomende woordgroepen , maar ook
om het vaststellen van collocaties. Men spreekt van een collocatie als
twee of meer woorden vaker bij elkaar voorkomen dan op statistische
grond verwacht mag worden.
- Het onderzoeken van tekstspecifiek vocabulaire
Hiermee wordt bedoeld dat wordt onderzocht welke woorden in een tekst
specifiek zijn voor die tekst. Dit gebeurt meestal door middel van een
statistische vergelijking van de frequentielijst van de specifieke
tekst met een frequentielijst die is gebaseerd op
een grote verzameling andere teksten (het zgn.
referentiebestand).
Programmatuur
Voorbeelden van concordantieprogramma's die in het verleden veel
gebruikt werden binnen de geesteswetenschappen zijn Oxford Concordance Program
en TACT.
Tegenwoordig wordt veel gebruik gemaakt van WordSmith (waarvoor onze faculteit een licentie bezit) en Concordance.
AntConc is een voorbeeld van een relatief eenvoudig freeware-programma. Dit is voor studenten en medewerkers van onze faculteit beschikbaar op VU-pc's.