Analys av sammansatta SALDO-lemgram inklusive sannolikhetsrankning
Token och deras ordklasser slås upp i SALDO-lexikonet för att berikas med sammansättningsinformation. Mer detaljerad information finns i Språkbanken Text FAQ.
Token och deras ordklasser slås upp i SALDO-lexikonet för att berikas med sammansättningsinformation. Mer detaljerad information finns i Språkbanken Text FAQ.
This analysis is used with Sparv. Check out Sparv's quick start guide to get started!
To use this analysis, add the following line under export.annotations
in the Sparv corpus configuration file:
- <token>:saldo.complemgram # Compound analysis using lemgrams
For more info on how to use Sparv, check out the Sparv documentation.
Example output:
<token complemgram="|">Språkbanken</token>
<token complemgram="|">Text</token>
<token complemgram="|">är</token>
<token complemgram="|">en</token>
<token complemgram="|forskning..nn.1+infrastruktur..nn.1:8.476e-13|">forskningsinfrastruktur</token>
<token complemgram="|">för</token>
<token complemgram="|">språkliga</token>
<token complemgram="|">data</token>
<token complemgram="|">och</token>
<token complemgram="|">en</token>
<token complemgram="|språk..nn.1+teknologisk..av.1:6.726e-13|språka..vb.1+teknologisk..av.1:4.035e-23|">språkteknologisk</token>
<token complemgram="|forskning..nn.1+enhet..nn.1:9.033e-13|">forskningsenhet</token>
<token complemgram="|">.</token>