Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

swe-pos-hunpos-suc3-1800

Citering Information

Språkbanken Text (2015). swe-pos-hunpos-suc3-1800 (uppdaterad: 2015-09-11). [Analysis]. Språkbanken Text.
Annotering av SUC-ordklasser med Hunpos för 1800-talssvenska

Meningssegment analyseras och annoteras med ordklasstaggar. Utöver ordklasstaggningsmodellen använder Hunpos listor med böjningsformer för att kunna generera bättre ordklasstaggar för 1800-talssvenska.

Exempel

This analysis is used with Sparv. Check out Sparv's quick start guide to get started!

To use this analysis, add the following line under export.annotations in the Sparv corpus configuration file:

- <token>:hunpos.pos  # Part-of-speech tags

In order to use this annotation you need to add the following setting to your Sparv corpus configuration file:

metadata:
  language: swe
  variety: "1800"

For more info on how to use Sparv, check out the Sparv documentation.

Example output:

<token pos="NN">Lådan</token>
<token pos="VB">var</token>
<token pos="PC">upphängd</token>
<token pos="PP">under</token>
<token pos="DT">den</token>
<token pos="NN">waggon</token>
<token pos="HA">hvari</token>
<token pos="DT">de</token>
<token pos="JJ">andra</token>
<token pos="NN">djuren</token>
<token pos="VB">befunno</token>
<token pos="PN">sig</token>
<token pos="MAD">.</token>

Övriga referenser

  • Hunpos: https://code.google.com/archive/p/hunpos/

Typ

  • Analys

Uppgift

part-of-speech tagging

Enhet

token

Verktyg

Hunpos

Modell

Taggmängd

Tränad på

Skapad

2012-10-23

Uppdaterad

2015-09-11

Kontakt

Språkbanken Text
sb-info@svenska.gu.se