Werkbank Geesteswetenschappen

Concordantie

Een concordantie is een alfabetische lijst van de woorden in een document of verzameling documenten, met hun directe context. Het maken van concordanties is een taak die computers uitstekend kunnen uitvoeren. De huidige concordantieprogramma's bieden een scala aan mogelijkheden, waarvan de onderstaande het meest voorkomend zijn.
N.B. In het onderstaande kan voor 'tekst' ook gelezen worden 'verzameling teksten'.

  • De productie van van frequentielijsten en concordanties
    Een frequentielijst is een woordenlijst waarin bij elk woord de frequentie ervan in de tekst wordt aangegeven. Meestal kunnen dergelijke overzichten op verschillende manieren worden gepresenteerd: oplopend of aflopend op frequentie, alfabetisch of als retrograde woordenlijst.
    Een concordantie is een overzicht van alle woorden in een tekst, of van een bepaalde selectie van woorden, waarbij van elk woord naast de vindplaats ook de context wordt getoond waarin het woord voorkomt. Meestal kan de gewenste omvang van de context worden ingesteld door de gebruiker en kan de concordantie worden geordend op rechter en/of linker context. Voorbeeld van een concordantie van de woordvormen grow, grew en grown in de roman Alice in Wonderland, geordend op rechter context.
  • Het zoeken naar woorden en woordgroepen
    Er kan op verschillende manieren worden gezocht naar woorden of woordgroepen die in een tekst voorkomen. Hierbij kan vaak gebruik worden gemaakt van  zgn. wildcards die het mogelijk maken om te zoeken naar woorden die beginnen of eindigen met bepaalde letters (b.v. alle woorden die beginnen met liefde of eindigen op heid). Tevens kunnen combinaties met bepaalde andere woorden worden vereist of juist worden uitgesloten en kan worden aangegeven dat men is geïnteresseerd in meerdere woorden (alternantie: 'woord A' of 'woord B' of 'woord C'). De uitvoer van de zoekopdracht wordt meestal getoond in de vorm van een een concordantie.
  • Het plotten van woorden
    Hiermee wordt een grafisch overzicht verkregen van de plaatsen waar een woord of een reeks woorden voorkomt in de tekst. Dit toont dus de spreiding (distributie) van woorden in een tekst.
  • Het analyseren van woordcombinaties
    Hieronder wordt verstaan dat de programmatuur analyseert met welke andere woorden een bepaald woord vooral wordt gecombineerd. Dit kan gaan om het simpel tellen van veelvoorkomende woordgroepen , maar ook om het vaststellen van collocaties. Men spreekt van een collocatie als twee of meer woorden vaker bij elkaar voorkomen dan op statistische grond verwacht mag worden.
  • Het onderzoeken van tekstspecifiek vocabulaire
    Hiermee wordt bedoeld dat wordt onderzocht welke woorden in een tekst specifiek zijn voor die tekst. Dit gebeurt meestal door middel van een statistische vergelijking van de frequentielijst van de specifieke tekst met een frequentielijst die is gebaseerd op een grote verzameling andere teksten (het zgn. referentiebestand).

Programmatuur

Voorbeelden van concordantieprogramma's die in het verleden veel gebruikt werden binnen de geesteswetenschappen zijn Oxford Concordance Program en TACT.  Tegenwoordig wordt veel gebruik gemaakt van WordSmith (waarvoor onze faculteit een licentie bezit) en Concordance.
AntConc is een voorbeeld van een relatief eenvoudig freeware-programma. Dit is voor studenten en medewerkers van onze faculteit beschikbaar op VU-pc's.