Hoppa till huvudinnehåll

Hur fungerar uppmärkningen av flerordsenheter i Sparv?

Flerordsenheter annoteras med hjälp av lexikonet SALDO, som utöver enskilda ord även innehåller en stor mängd flerordsuttryck. Exempel på flerordsuttryck kan vara uttryck som "komma på tal", "beta av" eller "ta sig vatten över huvudet". Varje ord i flerordsenheten får samma analys som om det inte vore del av en flerordsenhet, plus analys för flerordsenheten. Så för "komma på tal" blir det:

komma: komma|komma på tal
på: på|komma på tal:1
tal: tal|komma på tal:1

Alla ord förutom det första i flerordsenheten får ett siffersuffix som pekar tillbaka på det första ordets ref-värde (positionen i meningen) för att visa att de hänger ihop.