Synonymie en polysemie

Men spreekt van synonymie als woorden verschillen, maar wel hetzelfde betekenen. Een voorbeeld van synonymie zijn de woorden gevangenis, huis van bewaring en penitentiaire inrichting, die allemaal hetzelfde betekenen.

Men spreekt van polysemie als één woord meerdere betekenissen heeft. Het woord bank betekent bijvoorbeeld een meubelstuk, maar ook een financiële dienstverlener.

Het is verstandig rekening te houden met het bestaan van synonymie en polysemie bij het doen van een zoekwoorden onderzoek.

In het vakgebied van de Information Retrieval zijn synonymie en polysemie lastige problemen. Synonymie zorgt voor een lagere recall (vangst), niet alle relevante documenten worden gevonden. En polysemie zorgt voor een lage precision (precisie), niet alle gevonden documenten zijn relevant.

Met een statistische methode als Latent Dirichlet Allocation probeert men dergelijke problemen te ondervangen. Met deze methode is het mogelijk te herkennen dat teksten over hetzelfde onderwerp gaan, ook al gebruiken ze niet precies dezelfde woorden.