Samling SuperLim
A standardized suite for evaluation and analysis of Swedish natural language understanding systems. |
|
Korpus |
svenska |
|
CoDeRooMor, v.01
Dataset för morfologistudier (ordbildningsmorfologi), Svenska L2 profil-projektet |
|
Lexikon |
svenska |
|
DaLAJ v.1.0
Dataset for Linguistic Acceptability Judgments (and more), v.1.0., is a collection of sentences from SweLL (Swedish Learner Language) essays. Each DaLAJ sentence contains one error only |
|
Korpus |
svenska |
|
Dalin: Then Swänska Argus 1732-1734
Manuell transkription av Then Swänska Argus av Olof von Dalin, Stockholm, 1732–1734. För OCR analys. |
|
Korpus |
svenska |
|
Eukalyptus skriven svenska
En trädbank som innnehåller skriven svenska, uppmärkt med ordklasser, syntax i stil med TIGER-trädbanken, flerordsenheter och ordbetydelser |
|
Korpus |
svenska |
|
SemEval2020 Task 1
Svensk testdata för SemEval 2020 Task 1: Unsupervised Lexical Semantic Change Detection (utdrag ur Kubhist v2) |
|
Korpus |
svenska |
|
SIC2 - Stockholm Internet Corpus
Korpusen Stockholm Internet Corpus (SIC2) innehåller svenska bloggar som är annoterade med ordklasstaggar, morfologiska särdrag och namnentiteter. |
|
Korpus |
svenska |
|
SUC 2.0
Stockholm-Umeå-korpus 2.0 |
|
Korpus |
svenska |
|
SUC 3.0
Stockholm-Umeå-korpus 3.0 |
|
Korpus |
svenska |
|
SuperSim (paketterat för Superlim)
En test mängd för betydelsemässig likhet och koppling mellan svenska ord. |
|
Korpus |
svenska |
|
Svensk ABSAbank
Svensk annoterad korpus för aspektbaserad attitydanalys |
|
Korpus |
svenska |
|
Svensk ABSAbank-Imm 1.0
Svensk annoterad korpus för aspektbaserad attitydanalys (en version av Absabank) |
|
Korpus |
svenska |
|
Svensk analogi testmängd v1.0
Svensk semantisk och syntaktisk likhet: testmängd |
|
Korpus |
svenska |
|
Svensk fraktur 1626-1816
Ett urval av svensk fraktur texter tryckta mellan 1626 och 1816 från samlingarna på Universitetsbiblioteket vid Göteborgs universitet (UB). För OCR analys. |
|
Korpus |
svenska |
|
Svensk trädbank
En svensk trädbank med återanvändning av existerande resurser |
|
Korpus |
svenska |
|
Svenska tidningar 1818-1870
Ett urval av svenska tidningar tryckta mellan 1818 och 1870 från samlingarna på Kungliga biblioteket (KB). För OCR analys. |
|
Korpus |
svenska |
|
Svenska tidningar 1871-1906
Ett urval av svenska tidningar tryckta mellan 1871 och 1906 från samlingarna på Kungliga biblioteket (KB). För OCR analys. |
|
Korpus |
svenska |
|
SveParafras
En delmängd av referensdatan för semantisk textjämförelse (STS Benchmark). |
|
Korpus |
svenska |
|
SweDiagnostics
Svenska versionen av (Super)GLUE diagnostik |
|
Korpus |
svenska, engelska |
|
SweFraCas 1.0
Textual inference/entailment problem set |
|
Korpus |
svenska |
|
SweSAT Högskoleprovet ordförståelse
Högskoleprovet ordförståelse |
|
Lexikon |
svenska |
|
SweWiC
En svensk ord-i-sammanhang utvarderingsmängd. |
|
Korpus |
svenska |
|
SweWinogender
En svensk utvärderingsmängd för koreferens och könsbias. |
|
Korpus |
svenska |
|
SweWinograd
En svensk utvärderingsmängd för pronomentolkning. |
|
Korpus |
svenska |
|
Syntag trädbank
En svensk trädbank med syntaktisk analys av 158 artiklar ur Press-65. |
|
Korpus |
svenska |
|
TalbankenSBX
Talbanken är en svensk trädbank. Detta är Språkbanken Texts version av Talbanken. |
|
Korpus |
svenska |
|
TalbankenSTB
Talbanken är en svensk trädbank. |
|
Korpus |
svenska |
|
Vanliga frågor (randomiserad) 1.0
Vanliga frågor från svenska myndigheters webbsidor med svar i randomiserad ordning |
|
Korpus |
svenska |
|