Werkbank Geesteswetenschappen

Xaira

Beknopte beschrijving

Xaira (XML Aware Indexing and Retrieval Architecture) is een programma voor de exploratie ("searching, retrieving, and displaying") van taalkundige data die zijn opgeslagen in XML-formaat, zoals tekstcorpora. Xaira wordt in onze faculteit vooral gebruikt voor de exploratie van het British National Corpus (BNC).

Handleiding en practica

Xaira reference manual
Online handleiding voor het gebruik van Xaira onder Windows.

Introducing XAIRA briefly
Korte worksheet (van Guy Aston), die een introductie biedt in de basisfunctionaliteit van Xaira voor de exploratie van het BNC.

Exercising Xaira with BNC Baby
Reeks oefeningen (ontwikkeld door Martin Wynne) die het gebruik van Xaira illustreren voor exploratie van het corpus BNC Baby. Dit corpus benvat een subset van het BNC; de oefeningen zijn daardoor ook uitvoerbaar met het complete BNC.

Beschikbaarheid

Xaira is voor studenten en medewerkers van de faculteit der Geesteswetenschappen beschikbaar op VU-pc's.

Meer informatie

Xaira website.

Overige opmerkingen

Voor eenvoudige zoekopdrachten in het BNC kan ook gebruik worden gemaakt van het online zoekprogramma BYU-BNC. Hoewel dit beduidend minder mogelijkheden biedt dan Xaira, is het wel geschikt voor eenvoudige zoekopdrachten naar woorden, woordgroepen en woordsoorten, waarbij het zoekdomein kan worden beperkt tot specifieke genres van het BNC. Gebruik van wildcards en "fuzzy search" is mogelijk. De context van de uitvoer is bij BYU-BNC beperkt tot 80 woorden.

Xaira kan worden gebruikt voor het doorzoeken van alle welgevormde XML-documenten. Het zoekt echter niet in de tekst zelf, maar in indexen die daarop zijn gemaakt. Voordat XML-geannoteerde corpora met Xaira kunnen worden doorzocht, moeten deze daarom eerst worden geïndexeerd met behulp van het programma Xaira indexer. Meer informatie hierover is te vinden op de Xaira website. Het facultaire Bureau Informatisering biedt ondersteuning bij deze werkzaamheden.


Logo Xaira