swe-lexical_classes_text-sparv-blingbring

Citering

Språkbanken Text (2017). swe-lexical_classes_text-sparv-blingbring (uppdaterad: 2017-09-21). [Analysis]. Språkbanken Text.

Standardreferens

Lars Borin, Luis Nieto Piña, Richard Johansson (2015): Here be dragons? The perils and promises of inter-resource lexical-semantic mapping, in Linköping Electronic Conference Proceedings. Semantic resources and semantic annotation for Natural Language Processing and the Digital Humanities. Workshop at NODALIDA , May 11, 13-18 2015, Vilnius, volume 112, pages 1-11

Lexikala klasser från Blingbring på textnivå

Token slås upp i Blingbring för att berikas med information om sina lexikala klasser. Därefter berikas texter med information om lexikala klasser baserat på vilka klasser som är relevanta för token i dem.

Blingbring-frekvensmodellen](https://github.com/spraakbanken/sparv-models/blob/master/lexical_classes/blingbring.freq.gp2008%2Bsuc3%2Bromi.pickle) (tränad på Göteborgsposten 2008, SUC 3.0 och Bonniersromaner I (1976–77)) används som referens för att rangordna de Blingbring-klasser som förekommer i varje text. Med hjälp av informationen om lexikala klasser på tokennivå beräknar och tilldelar modellen de mest relevanta klasserna för varje text. Dessa klasser filtreras och rangordnas baserat på sin frekvens och dominans jämfört med referensmaterialet.

Dominans avser i detta fallet den relativa betydelsen för en lexikal klass i en given text jämfört med ett referensmaterial. Dominansen beräknas genom att jämföra den observerade frekvensen av en lexikal klass i texten med dess förväntade (relativa) frekvens i referensmaterialet.

Blingbring (version 0.2) bygger på innehållet i Brings Svenskt ordförråd ordnat i begreppsklasser (1930). Ingångarna i Blingbring har försetts med motsvarande SALDO-ordbetydelser. I föreliggande version är ordbetydelselänkarna ibland flertydiga, något som kommer att åtgärdas i framtida versioner.

Exempel

This analysis is used with Sparv. Check out Sparv's quick start guide to get started!

To use this analysis, add the following line under export.annotations in the Sparv corpus configuration file:

- <text>:lexical_classes.blingbring  # Lexical classes for text chunks from Blingbring

For more info on how to use Sparv, check out the Sparv documentation.

Example output:

<text blingbring="|brunt:352.54|uttryckslöshet:140.741|rött:135.333|">
  <token>Rödräv</token>
  <token>eller</token>
  <token>vanlig</token>
  <token>räv</token>
  <token>är</token>
  <token>ett</token>
  <token>hunddjur</token>
  <token>och</token>
  <token>den</token>
  <token>mest</token>
  <token>förekommande</token>
  <token>arten</token>
  <token>i</token>
  <token>rävsläktet</token>
  <token>.</token>
</text>

Övriga referenser

Lars Borin, Jens Allwood, Gerard de Melo (2014): Bring vs. MTRoget: Evaluating automatic thesaurus translation, in Proceedings of LREC 2014, May 26-31, 2014 Reykjavik, Iceland

swe-lexical_classes_text-sparv-blingbring

Citering

Standardreferens

Exempel

Övriga referenser

Del av samling

Typ

Uppgift

Enhet

Verktyg

Modell

Taggmängd

Tränad på

Skapad

Uppdaterad

Kontakt