Werkbank Geesteswetenschappen

WordSmith Tools

Beknopte beschrijving

WordSmith Tools is een verzameling programma-onderdelen die gebruikt kunnen worden bij de analyse van tekstbestanden. De belangrijkste zijn:

  • Concord: voor het maken van concordanties van het voorkomen van bepaalde woorden of woordgroepen. Door dit programma-onderdeel kunnen ook diverse overzichten worden geproduceerd die inzicht verschaffen in de lexicale patronen die in de tekst voorkomen (zoals collocaties en woordclusters), evenals overzichten van de plaats waar bepaalde woorden voorkomen in een tekst ('word plots'). Bij het definiëren van zoekpatronen kunnen ook zgn. wildcards worden gebruikt. Concord is het belangrijkste onderdeel van WordSmith.
  • Wordlist: voor het produceren van woordenlijsten en frequentielijsten op basis van de inhoud van één of meer tekstbestanden. Vanuit dit onderdeel kan ook informatie worden verkregen over de zgn. 'mutual information score' van bepaalde woorden, die aangeeft welke woorden significant vaak in elkaars omgeving worden aangetroffen.
  • Keywords: voor het identificeren van 'keywords' in een tekstbestand; dit zijn de woorden waarvan de frequentie hoog is vergeleken met een algemene norm. Om dit onderdeel te kunnen gebruiken is een referentiebestand nodig met algemene frequentiegegevens.

Handleiding en practicum

Manual Wordsmith 4
Online handleiding voor WordSmith Tools 4.0.

Introductiepracticum WordSmith 4: Concord
Practicum van plm. 2 uur waarin je leert werken met het onderdeel Concord van WordSmith.

Beschikbaarheid

WordSmith is voor studenten en medewerkers van de faculteit der Geesteswetenschappen beschikbaar op VU-pc's.

Meer informatie

Wordsmith website
De WordSmith website biedt veel informatie over het programma en over daaraan gerelateerde zaken. Je kunt hier ook handleidingen van verschillende WordSmithversies downloaden.

Overige opmerkingen

WordSmith kan alleen worden gebruikt om teksten te doorzoeken die zijn opgeslagen in zgn. plain ASCII-formaat. Dit geldt voor de meeste tekstcorpora die worden aangeboden via het facultaire netwerk. HTML- en XML-bestanden zijn ook opgeslagen in dit formaat. Word- en pdf-bestanden moeten eerst worden omgezet naar dit formaat voordat er met WordSmith in kan worden gezocht (Word: Bestand > Opslaan als > Opslaan als: Tekst zonder opmaak (*.txt))

Als alternatief voor het commerciële programma WordSmith kan voor thuisgebruik eventueel het programma AntConc worden gebruikt. Dit biedt wel wat minder mogelijkheden dan WordSmith.


Logo WordSmith