Werkbank Geesteswetenschappen

Startpagina > Tekstanalyse > Stylometrie

Stylometrie

Stylometrie is de wetenschap die de persoonlijke elementen in een uiting (waaronder ook een tekst valt) kan beschrijven en meten, zodanig dat kan worden vastgesteld welke persoon verantwoordelijk is voor de creatie ervan. Centraal daarbij staat de kwantificering van stijlelementen, zoals woord en zinslengte, gebruik van interpunctie, gebruik van bepaalde spellingsvarianten, uitdrukkingen, voorkeur voor bepaalde synoniemen, etc.. Statistische analyse is vanouds een belangrijke peiler van stylometrie. Tegenwoordig worden ook technieken op het gebied van kunstmatige intelligentie toegepast.

Een belangrijke toepassing van stylometrie is auteurbepaling (authorship attribution). Zo kan deze techniek gebruikt worden bij het beantwoorden van vragen als:
  • Welke van de 35 aan Lysias toegeschreven redevoeringen zijn daadwerkelijk van hem?
  • Is de Historia Augusta geschreven door één auteur of door zes?
  • Is de auteur van de Ilias dezelfde als van de Odyssee?
  • Zijn alle toneelstukken die worden toegeschreven aan Shakespeare wel echt (helemaal) van zijn hand?
  • Wat is de herkomst van de gedeelde boeken van de Ethica Nicomachea van Aristoteles en de Ethica Eudemia, die wordt toegeschreven aan één van zijn pupillen (zie Wake 1957 )?

Title page of the first collection of The Federalist Papers (1788). Een veelgenoemde toepassing is de auteurbepaling van de "Federalist Papers", een reeks artikelen gepubliceerd in 1787-88 met als doel de ratificatie van de nieuwe Amerikaanse constitutie te promoten. Ze zijn geschreven door drie auteurs, Jay, Hamilton and Madison, onder het pseudoniem “Publius”. Van sommige artikelen was de auteur bekend, van een aantal stond dit echter ter discussie. De onderzoekers Mosteller en Wallace hebben in het begin van de jaren 60 van de vorige eeuw stylometrische methoden toegepast in een poging om deze onduidelijkheid op te lossen.

Een interessant voorbeeld van een relatief eenvoudig programma op dit gebied is Signature, dat is ontwikkeld om stylometrische analyse en vergelijkingen van teksten te ondersteunen, met speciale aandacht voor auteuridentificatie.

Meer informatie

Grieve, J.W. (2005). Quantitatiev Authorship Distribution: A History And An Evaluation of Techniques. Master thesis, Dept. of Linguistics, Simon Fraser University.
http://summit.sfu.ca/system/files/iritems1/8840/etd1721.pdf (geraadpleegd op 15-3-2016).

Overige pagina's in deze rubriek: Introductie   Lexicale analyse   Kwalitatieve analyse   Inhoudsanalyse   Text mining