Hoppa till huvudinnehåll

Resurser

Här kan du leta och filtrera bland våra korpusar och lexikon. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på Korp- eller Karp-ikonen kommer du direkt till gränssnittet där du kan utforska resursen.

Filtrera

Resurs Utforska Typ Språk Ladda ner
Samling
SuperLim

A standardized suite for evaluation and analysis of Swedish natural language understanding systems.

Korpus swe
CoDeRooMor, v.01

Dataset för morfologistudier (ordbildningsmorfologi), Svenska L2 profil-projektet

Lärka
Lexikon swe
DaLAJ v.1.0

Dataset for Linguistic Acceptability Judgments (and more), v.1.0., is a collection of sentences from SweLL (Swedish Learner Language) essays. Each DaLAJ sentence contains one error only

Korpus swe
Dalin: Then Swänska Argus 1732-1734

Manuell transkription av Then Swänska Argus av Olof von Dalin, Stockholm, 1732–1734. För OCR analys.

Korpus swe
Eukalyptus skriven svenska

En trädbank som innnehåller skriven svenska, uppmärkt med ordklasser, syntax i stil med TIGER-trädbanken, flerordsenheter och ordbetydelser

Korpus swe
SemEval2020 Task 1

Svensk testdata för SemEval 2020 Task 1: Unsupervised Lexical Semantic Change Detection (utdrag ur Kubhist v2)

Korpus swe
SIC2 - Stockholm Internet Corpus

Korpusen Stockholm Internet Corpus (SIC2) innehåller svenska bloggar som är annoterade med ordklasstaggar, morfologiska särdrag och namnentiteter.

Korp
Korpus swe
SUC 2.0

Stockholm-Umeå-korpus 2.0

Korp
Korpus swe
SUC 3.0

Stockholm-Umeå-korpus 3.0

Korp
Korpus swe
SuperSim (paketterat för Superlim)

En test mängd för betydelsemässig likhet och koppling mellan svenska ord.

Korpus swe
Svensk ABSAbank

Svensk annoterad korpus för aspektbaserad attitydanalys

Korpus swe
Svensk ABSAbank-Imm 1.0

Svensk annoterad korpus för aspektbaserad attitydanalys (en version av Absabank)

Korpus swe
Svensk analogi testmängd v1.0

Svensk semantisk och syntaktisk likhet: testmängd

Korpus swe
Svensk fraktur 1626-1816

Ett urval av svensk fraktur texter tryckta mellan 1626 och 1816 från samlingarna på Universitetsbiblioteket vid Göteborgs universitet (UB). För OCR analys.

Korpus swe
Svensk trädbank

En svensk trädbank med återanvändning av existerande resurser

Korpus swe
Svenska tidningar 1818-1870

Ett urval av svenska tidningar tryckta mellan 1818 och 1870 från samlingarna på Kungliga biblioteket (KB). För OCR analys.

Korpus swe
Svenska tidningar 1871-1906

Ett urval av svenska tidningar tryckta mellan 1818 och 1870 från samlingarna på Kungliga biblioteket (KB). För OCR analys.

Korpus swe
SveParafras

En delmängd av referensdatan för semantisk textjämförelse (STS Benchmark).

Korpus swe
SweDiagnostics

Svenska versionen av (Super)GLUE diagnostik

Korpus swe, eng
SweFraCas 1.0

Textual inference/entailment problem set

Korpus swe
SweSAT Högskoleprovet ordförståelse

Högskoleprovet ordförståelse

Lexikon swe
SweWiC

En svensk ord-i-sammanhang utvarderingsmängd.

Korpus swe
SweWinogender

En svensk utvärderingsmängd för koreferens och könsbias.

Korpus swe
SweWinograd

En svensk utvärderingsmängd för pronomentolkning.

Korpus swe
Syntag trädbank

En svensk trädbank med syntaktisk analys av 158 artiklar ur Press-65.

Korpus swe
TalbankenSBX

Talbanken är en svensk trädbank. Detta är Språkbanken Texts version av Talbanken.

Korp
Korpus swe
TalbankenSTB

Talbanken är en svensk trädbank.

Korpus swe
Vanliga frågor (randomiserad) 1.0

Vanliga frågor från svenska myndigheters webbsidor med svar i randomiserad ordning

Korpus swe