Hoppa till huvudinnehåll

Språkresurser

Här kan du leta och filtrera bland våra korpusar och lexikon. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på Korp- eller Karp-ikonen kommer du direkt till gränssnittet där du kan utforska resursen.
Resurs Utforska Typ Språk Ladda ner
Samling
SuperLim
A standardized suite for evaluation and analysis of Swedish natural language understanding systems.
Korpus svenska
CoDeRooMor, v.01
Dataset för morfologistudier (ordbildningsmorfologi), Svenska L2 profil-projektet
Lärka
Lexikon svenska
DaLAJ v.1.0
Dataset for Linguistic Acceptability Judgments (and more), v.1.0., is a collection of sentences from SweLL (Swedish Learner Language) essays. Each DaLAJ sentence contains one error only
Korpus svenska
Dalin: Then Swänska Argus 1732-1734
Manuell transkription av Then Swänska Argus av Olof von Dalin, Stockholm, 1732–1734. För OCR analys.
Korpus svenska
Eukalyptus skriven svenska
En trädbank som innnehåller skriven svenska, uppmärkt med ordklasser, syntax i stil med TIGER-trädbanken, flerordsenheter och ordbetydelser
Korpus svenska
SemEval2020 Task 1
Svensk testdata för SemEval 2020 Task 1: Unsupervised Lexical Semantic Change Detection (utdrag ur Kubhist v2)
Korpus svenska
SIC2 - Stockholm Internet Corpus
Korpusen Stockholm Internet Corpus (SIC2) innehåller svenska bloggar som är annoterade med ordklasstaggar, morfologiska särdrag och namnentiteter.
Korp
Korpus svenska
SUC 2.0
Stockholm-Umeå-korpus 2.0
Korpus svenska
SUC 3.0
Stockholm-Umeå-korpus 3.0
Korp
Korpus svenska
SuperSim (paketterat för Superlim)
En test mängd för betydelsemässig likhet och koppling mellan svenska ord.
Korpus svenska
Svensk ABSAbank
Svensk annoterad korpus för aspektbaserad attitydanalys
Korpus svenska
Svensk ABSAbank-Imm 1.0
Svensk annoterad korpus för aspektbaserad attitydanalys (en version av Absabank)
Korpus svenska
Svensk analogi testmängd v1.0
Svensk semantisk och syntaktisk likhet: testmängd
Korpus svenska
Svensk fraktur 1626-1816
Ett urval av svensk fraktur texter tryckta mellan 1626 och 1816 från samlingarna på Universitetsbiblioteket vid Göteborgs universitet (UB). För OCR analys.
Korpus svenska
Svensk trädbank
En svensk trädbank med återanvändning av existerande resurser
Korpus svenska
Svenska tidningar 1818-1870
Ett urval av svenska tidningar tryckta mellan 1818 och 1870 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
Korpus svenska
Svenska tidningar 1871-1906
Ett urval av svenska tidningar tryckta mellan 1871 och 1906 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
Korpus svenska
SveParafras
En delmängd av referensdatan för semantisk textjämförelse (STS Benchmark).
Korpus svenska
SweDiagnostics
Svenska versionen av (Super)GLUE diagnostik
Korpus svenska, engelska
SweFraCas 1.0
Textual inference/entailment problem set
Korpus svenska
SweSAT Högskoleprovet ordförståelse
Högskoleprovet ordförståelse
Lexikon svenska
SweWiC
En svensk ord-i-sammanhang utvarderingsmängd.
Korpus svenska
SweWinogender
En svensk utvärderingsmängd för koreferens och könsbias.
Korpus svenska
SweWinograd
En svensk utvärderingsmängd för pronomentolkning.
Korpus svenska
Syntag trädbank
En svensk trädbank med syntaktisk analys av 158 artiklar ur Press-65.
Korpus svenska
TalbankenSBX
Talbanken är en svensk trädbank. Detta är Språkbanken Texts version av Talbanken.
Korp
Korpus svenska
TalbankenSTB
Talbanken är en svensk trädbank.
Korpus svenska
Vanliga frågor (randomiserad) 1.0
Vanliga frågor från svenska myndigheters webbsidor med svar i randomiserad ordning
Korpus svenska