Skip to main content
Språkbanken Text is a department within Språkbanken.

Hur fungerar uppmärkningen av flerordsenheter i Sparv?

Flerordsenheter annoteras med hjälp av lexikonet SALDO, som utöver enskilda ord även innehåller en stor mängd flerordsuttryck. Exempel på flerordsuttryck kan vara uttryck som "komma på tal", "beta av" eller "ta sig vatten över huvudet". Varje ord i flerordsenheten får samma analys som om det inte vore del av en flerordsenhet, plus analys för flerordsenheten. Så för "komma på tal" blir det:

komma: komma|komma  tal
på: på|komma  tal:1
tal: tal|komma  tal:1

Alla ord förutom det första i flerordsenheten får ett siffersuffix som pekar tillbaka på det första ordets ref-värde (positionen i meningen) för att visa att de hänger ihop.