Hoppa till huvudinnehåll

sbx-swe-readability-sparv-ovix

Analyscitering Information

Språkbanken Text (2018). sbx-swe-readability-sparv-ovix (uppdaterad: 2018-03-28). [Analysis]. Språkbanken Text. https://doi.org/10.23695/v8w3-pb64
BibTeX Ytterligare sätt att citera datamängden.
Annotering av svenska texter med OVIX-värden som indikerar hur lätt eller svår en text är att läsa

OVIX är ett läsbarhetsvärde som baseras på andelen ord som endast förekommer en gång i texten.

OVIX räknas ut med formeln log(tokens) / log(2 - (log(types) / log(tokens)))

Ett högt värde betyder i princip att läsaren ofta introduceras för nya ord. Å andra sidan kan ett lågt värde indikera en monoton text.

Exempel

This analysis is used with Sparv. Check out Sparv's quick start guide to get started!

To use this analysis, add the following line under export.annotations in the Sparv corpus configuration file:

- :readability.ovix  # OVIX values for text chunks

For more info on how to use Sparv, check out the Sparv documentation.

Example output:


  Det
  här
  är
  en
  enkel
  mening
  .


  LIX
  (
  Björnsson
  ,
  1968
  )
  är
  ett
  läsbarhetsvärde
  beräknat
  
  genomsnittligt
  antal
  ord
  per
  mening
  och
  andel
  långa
  ord
  (
  över
  sex
  bokstäver
  långa
  )
  .

Tillgänglig via

Åtkomst Plattform Licens
CC-BY-4.0

Typ

  • Analys

Uppgift

  • läsbarhetsvärden

Enhet

  • text

Licens

MIT

Skapad

2018-03-28

Uppdaterad

2018-03-28

Kontakt

sb-info@svenska.gu.se