Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

swe-readability-sparv-ovix

Citering Information

Språkbanken Text (2018). swe-readability-sparv-ovix (uppdaterad: 2018-03-28). [Analysis]. Språkbanken Text.
Annotering av svenska texter med OVIX-värden som indikerar hur lätt eller svår en text är att läsa

OVIX är ett läsbarhetsvärde som baseras på andelen ord som endast förekommer en gång i texten.

OVIX räknas ut med formeln log(tokens) / log(2 - (log(types) / log(tokens)))

Ett högt värde betyder i princip att läsaren ofta introduceras för nya ord. Å andra sidan kan ett lågt värde indikera en monoton text.

Exempel

This analysis is used with Sparv. Check out Sparv's quick start guide to get started!

To use this analysis, add the following line under export.annotations in the Sparv corpus configuration file:

- <text>:readability.ovix  # OVIX values for text chunks

For more info on how to use Sparv, check out the Sparv documentation.

Example output:

<text ovix="inf">
  <token>Det</token>
  <token>här</token>
  <token>är</token>
  <token>en</token>
  <token>enkel</token>
  <token>mening</token>
  <token>.</token>
</text>
<text ovix="94.13">
  <token>LIX</token>
  <token>(</token>
  <token>Björnsson</token>
  <token>,</token>
  <token>1968</token>
  <token>)</token>
  <token>är</token>
  <token>ett</token>
  <token>läsbarhetsvärde</token>
  <token>beräknat</token>
  <token></token>
  <token>genomsnittligt</token>
  <token>antal</token>
  <token>ord</token>
  <token>per</token>
  <token>mening</token>
  <token>och</token>
  <token>andel</token>
  <token>långa</token>
  <token>ord</token>
  <token>(</token>
  <token>över</token>
  <token>sex</token>
  <token>bokstäver</token>
  <token>långa</token>
  <token>)</token>
  <token>.</token>
</text>

Typ

  • Analys

Uppgift

readability measures

Enhet

text

Verktyg

Sparv

Skapad

2018-03-28

Uppdaterad

2018-03-28

Kontakt

Språkbanken Text
sb-info@svenska.gu.se