WordSmith Tools
Beknopte beschrijving
WordSmith Tools is een verzameling programma-onderdelen die gebruikt kunnen worden bij de
analyse van tekstbestanden. De belangrijkste zijn:
-
Concord: voor het maken van concordanties van het voorkomen van bepaalde woorden of woordgroepen.
Door dit programma-onderdeel kunnen ook diverse overzichten worden
geproduceerd die inzicht verschaffen in de lexicale patronen die in de tekst
voorkomen (zoals collocaties en woordclusters), evenals overzichten van de
plaats waar bepaalde woorden voorkomen in een tekst ('word plots'). Bij het definiëren van zoekpatronen
kunnen ook zgn. wildcards worden gebruikt. Concord
is het belangrijkste onderdeel van WordSmith.
-
Wordlist: voor het produceren van woordenlijsten en frequentielijsten op basis van de
inhoud van één of meer tekstbestanden. Vanuit dit onderdeel kan ook
informatie worden verkregen over de zgn. 'mutual information score' van
bepaalde woorden, die aangeeft welke woorden significant vaak in elkaars
omgeving worden aangetroffen.
-
Keywords: voor het identificeren van 'keywords' in een tekstbestand; dit zijn de woorden
waarvan de frequentie hoog is vergeleken met een algemene norm. Om dit
onderdeel te kunnen gebruiken is een referentiebestand nodig met algemene
frequentiegegevens.
Handleiding en practicum
Manual Wordsmith 4
Online handleiding voor WordSmith Tools 4.0.
Introductiepracticum
WordSmith 4: Concord
Practicum van plm. 2 uur waarin je leert werken met het onderdeel Concord van WordSmith.
Beschikbaarheid
WordSmith is voor studenten en medewerkers van de faculteit der Geesteswetenschappen beschikbaar op VU-pc's.
Meer informatie
Wordsmith website
De WordSmith website biedt veel informatie over het programma en over daaraan gerelateerde zaken. Je kunt hier ook handleidingen van verschillende WordSmithversies downloaden.
Overige opmerkingen
WordSmith kan alleen worden gebruikt om teksten te doorzoeken die zijn opgeslagen in zgn. plain ASCII-formaat. Dit geldt voor de meeste tekstcorpora die worden aangeboden via het facultaire netwerk. HTML- en XML-bestanden zijn ook opgeslagen in dit formaat. Word- en pdf-bestanden moeten eerst worden omgezet naar dit formaat voordat er met WordSmith in kan worden gezocht (Word: Bestand > Opslaan als > Opslaan als: Tekst zonder opmaak (*.txt))
Als alternatief voor het commerciële programma WordSmith kan voor thuisgebruik eventueel het programma AntConc worden gebruikt. Dit biedt wel wat minder mogelijkheden dan WordSmith.