Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

swe-lexical_classes_text-sparv-swefn

Citering Information

Språkbanken Text (2017). swe-lexical_classes_text-sparv-swefn (uppdaterad: 2017-09-21). [Analysis]. Språkbanken Text.
BibTeX
Lexikala klasser från SweFN på textnivå

Token slås upp i Svenskt frasnät (SweFN, en lexikal-semantisk resurs som är baserad på teorin om ramsemantik) för att berikas med information om sina lexikala klasser. Därefter berikas texter med information om lexikala klasser baserat på vilka klasser som är relevanta för token i dem.

SweFN-frekvensmodellen (tränad på Göteborgsposten 2008, SUC 3.0 och Bonniersromaner I (1976–77)) används som referens för att rangordna de SweFN-klasser som förekommer i varje text. Med hjälp av informationen om lexikala klasser på tokennivå beräknar och tilldelar modellen de mest relevanta klasserna för varje text. Dessa klasser filtreras och rangordnas baserat på sin frekvens och dominans jämfört med referensmaterialet.

Dominans avser i detta fallet den relativa betydelsen för en lexikal klass i en given text jämfört med ett referensmaterial. Dominansen beräknas genom att jämföra den observerade frekvensen av en lexikal klass i texten med dess förväntade (relativa) frekvens i referensmaterialet.

Exempel

This analysis is used with Sparv. Check out Sparv's quick start guide to get started!

To use this analysis, add the following line under export.annotations in the Sparv corpus configuration file:

- <text>:lexical_classes.swefn  # Lexical classes for text chunks from SweFN

For more info on how to use Sparv, check out the Sparv documentation.

Example output:

<text swefn="|Type:149.863|Animals:137.544|Typicality:107.808|">
  <token>Rödräv</token>
  <token>eller</token>
  <token>vanlig</token>
  <token>räv</token>
  <token>är</token>
  <token>ett</token>
  <token>hunddjur</token>
  <token>och</token>
  <token>den</token>
  <token>mest</token>
  <token>förekommande</token>
  <token>arten</token>
  <token>i</token>
  <token>rävsläktet</token>
  <token>.</token>
</text>

Övriga referenser

  • Dana Dannélls, Lars Borin, Karin Friberg Heppin (2021): The Swedish FrameNet++ Harmonization, integration, method development and practical language technology applications. John Benjamins: Amsterdam, Philadelphia. ISBN 978 90 272 5848 9.

Typ

  • Analys

Uppgift

  • lexical classes

Enhet

  • text

Verktyg

Sparv

Tränad på

Reference corpora for relative frequencies: Göteborgsposten 2008, SUC 3.0, Bonniersromaner I (1976–77)

Skapad

2017-09-21

Uppdaterad

2017-09-21

Kontakt

Språkbanken Text
sb-info@svenska.gu.se