Hoppa till huvudinnehåll

Språkresurser

Här kan du leta och filtrera bland våra korpusar och lexikon. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på Korp- eller Karp-ikonen kommer du direkt till gränssnittet där du kan utforska resursen.
Resurs Typ Språk Åtkomst
Somaliska: Sheekooyin Carruureed
Korpus somali
Fornsvenska textbankens material: Nysvenska lagar
Korpus svenska
Somaliska: Afka Hooyo 2010–19 Iswiidhan
Korpus somali
Folkekorpus
Uppteckningar från Isofs arkiv
Korpus svenska
Äldre finlandssvenska: Fredrikshamns Tidning 1888–1908
Tidning som utkom i Fredrikshamn 1884–1910
Korpus svenska
Äldre finlandssvenska: Wiborgs Tidning 1867–1877
Tidning som utkom i Viborg åren 1864–1881
Korpus svenska
Sibirientyska kvinnor
Samtal med fyra kvinnor födda mellan 1927 och 1937 i sovjetiska Volgarepubliken
Korpus svenska
Kubhist 2: Posttidningar 1660-talet
Del av samlingen Kubhist 2
Korpus svenska
Somaliska: Maaddooyinka Kale 1972–79
Korpus somali
Somaliska: Sheekooyin Carruureed (Turjuman)
Korpus somali
SIC2 - Stockholm Internet Corpus
Korpusen Stockholm Internet Corpus (SIC2) innehåller svenska bloggar som är annoterade med ordklasstaggar, morfologiska särdrag och namnentiteter.
Korpus svenska
Somaliska: Caafimaad 1972–79
Korpus somali
Äldre finlandssvenska: Uleåborgs Tidning 1877–1887
Tidning som utkom i Uleåborg 1877–1891
Korpus svenska
Äldre finlandssvenska: Typografiskt minnesblad 1891
Utkom 1642–1892
Korpus svenska
Kubhist 2: Posttidningar 1650-talet
Del av samlingen Kubhist 2
Korpus svenska
Af Soomaali 1993-94
Korpus somali
Somaliska: Suugaan (Turjuman)
Korpus somali
Äldre finlandssvenska: Tidningar Utgifne af et Sällskap i Åbo 1771–1783
Finlands första tidning. Starkt knuten till Aurorasällskapet och Henrik Gabriel Porthan. Utkom i Åbo åren 1771–1778 och 1782–1785.
Korpus svenska
Kubhist 2: Posttidningar 1670-talet
Del av samlingen Kubhist 2
Korpus svenska
Äldre finlandssvenska: Borgåbladet 1885
Tidning som utkommer i Borgå
Korpus svenska
Kubhist 2: Götheborgs Weckolista 1740-talet
Del av samlingen Kubhist 2
Korpus svenska
Kubhist: Götheborgs weckolista 1740-talet
Del av samlingen Kubhist
Korpus svenska
Caafimaad 1983
Korpus somali
IVIP demo
Interaktion och variation i pluricentriska språk – Kommunikativa mönster i sverigesvenska och finlandssvenska.
Korpus svenska
Schlyter
Ordbok över svenska medeltidsspråket
Lexikon svenska
Idiom ur NEO-databasen
Idiom med beskrivningar och alternativformer extraherade ut databasen för Nationalencyklopediens ordbok
Lexikon svenska
SweWinograd 2.0
En svensk datamängd för pronomentolkning
Korpus svenska
Dalins morfologi
En morfologi från Dalins ordbok - Ordbok över 1800-talsspråket, som härleds ur Dalins basmaterial.
Lexikon svenska
Svenskt frasnät (SweFN)
En lexikal-semantisk resurs baserad på samma principer som engelska Berkeley FrameNet. Denna del av resursen innehåller de semantiska ramarna och det manuellt annoterade semantiska innehållet.
Lexikon svenska
Samling
SuperLim 2
A standardized suite for evaluation and analysis of Swedish natural language understanding systems.
Korpus svenska
Samling
Riksdagens öppna data
Data från data.riksdagen.se
Korpus svenska
LingFN-thesis
Ett domänspecifikt frasnät med lingvistiska termer
Lexikon svenska
Samling
Europarl
European Parliament Proceedings Parallel Corpus
Korpus svenska, danska, tyska, modern greek (1453-), engelska, spanska, finska, franska, italienska, nederländska, portugisiska
UNSC-Graph
En utvidgbar kunskapsgraf för UNSC-korpusen med detaljer om deltagare och debatter från FN:s säkerhetsråd 1995-2020
Lexikon engelska
SenSALDO
SenSALDO, SALDO-ingångar och textord med attitydinformation
Lexikon svenska
Ordklasstaggningsmodell: Flair
Förtränade modeller för ordklasstaggning.
Modell svenska
Diakronisk pivot
Diakronisk pivotresurs där historisk lexikal information länkas till SALDO
Lexikon svenska
SweSAT Högskoleprovet ordförståelse 1.1
Högskoleprovet ordförståelse
Lexikon svenska
MAÞiR Ord
Fornsvensk lexikal resurs baserad på Söderwalls ordbok, lämpligt för bl a konstruktion av lemmatiseringsmodeller.
Lexikon svenska
Samling
SVT nyheter
Nyhetstexter från svt.se
Korpus svenska
lsilex
Ett lexikon framtaget inom LSI-projektet
Lexikon svenska
Samling
Läkartidningen
Korpus för vårdens och omsorgens fackspråk
Korpus svenska
Samling
NPEGL
En databas över nominalfraser i äldre germanska språk.
Lexikon fornengelska (ca 450-1100), fornhögtyska (ca 750-1050), fornisländska, fornsaxiska
Sentimentlexikon
Sentimentlexikon för svenska baserad på SALDO
Lexikon svenska
Ordklasstaggningsmodell: Marmot
Förtränade modeller för ordklasstaggning.
Modell svenska
Fornsvensk morfologi
Fornsvensk morfologi ur Söderwall och Schlyter
Lexikon svenska
Swesaurus
Ett svenskt ordnät
Lexikon svenska
Samling
Finlandssvenska
Del av finlandssvensk språkbank över svenskan i Finland i dag och i går
Korpus svenska
LWT
Lånordstypologi
Lexikon svenska, engelska
Samling
Press
Svensk press
Korpus svenska
Svensk ABSAbank-Imm 1.1
Svensk annoterad korpus för aspektbaserad attitydanalys (en version av Absabank)
Korpus svenska
Akademisk ordlista
Akademisk ordlista
Lexikon svenska
Simple lexikon
Svenskt SIMPLE lexikon - En språkteknologisk resurs med semantisk information
Lexikon svenska
Lemmatiseringsmodell: Stanza
Förtränad modell för lemmatisering.
Modell svenska
Hellquists Svensk etymologisk ordbok
Hellquists Svensk etymologisk ordbok
Lexikon svenska
Svensk-finska ordlistor
Svensk-finska ordlistor inom olika ämnesområden
Lexikon svenska
Samling
Äldre finlandssvenska
Del av finlandssvensk språkbank över svenskan i Finland i dag och i går
Korpus svenska
LWT-PWN
LWT-PWN är IDS/LWT-begreppslistan med länkar till ordbetydelseidentifierare i Princeton WordNet 3.0.
Lexikon svenska
Samling
Medeltidsbrev
Svenskt Diplomatariums huvudkartotek över medeltidsbreven (SDHK)
Korpus latin, tyska, norska, svenska
SuperSim (paketterat för Superlim) 2.0
En datamängd för betydelsemässig likhet och koppling mellan svenska ord.
Korpus svenska
SweDiagnostics
Svenska versionen av (Super)GLUE diagnostik
Korpus svenska
Aventinus
Narkotikarelaterad terminologi
Lexikon svenska
Simple+
Svenskt SIMPLE lexikon - En språkteknologisk resurs med semantisk information, kopplade till betydelser i SALDO
Lexikon svenska
Ordklasstaggningsmodell: Stanza
Förtränade modeller för ordklasstaggning.
Modell svenska
Kelly
Nyckelord för språkinlärning för unga och vuxna
Lexikon svenska
Yrkesbeteckningar
En lista över yrkesbeteckningar på svenska
Lexikon svenska
Samling
Familjeliv
Material från diskussionsforumet Familjeliv
Korpus svenska
OSA (SAOB)
Svenska Akademiens ordbok på nätet
Lexikon svenska
Samling
Somaliska korpusar
En samling av korpusar på somaliska
Korpus somali
Blingbring
Blingbring, en SALDO-länkad och moderniserad version av Brings "Svenskt ordförråd ordnat i begreppsklasser" (1930)
Lexikon svenska
SKBL
Svenskt kvinnobiografiskt lexikon
Lexikon svenska, engelska
Dependensparsningsmodell: Stanza
Förtränade modeller för dependensparsning.
Modell svenska
Konstruktikon
Ett svenskt konstruktikon
Lexikon svenska
WordNet-SALDO
En länkning mellan SALDO och Core WordNet
Lexikon svenska, engelska
Samling
Bloggmix
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus svenska
Parole
Svenskt PAROLE lexikon - En språkteknologisk resurs med syntaktisk information
Lexikon svenska
Samling
Webbnyheter
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Samling
Tvåkammarriksdagen
Samling av textdokument från Tvåkammarriksdagen
Korpus svenska
Svensk trädbank
En svensk trädbank med återanvändning av existerande resurser
Korpus svenska
SweLL-gold
Uppsatser svrivna av vuxenstuderande i svenska, manuellt pseudonymiserade och annoterade med felkategorier. Korpusen innehåller både originaltexten och en normaliserad version av varje uppsats. Insamlingperiod 2017-2020.
Korpus svenska
Bliss
Bliss är ett konstruerat symbolspråk som främst används av personer med grava kommunikativa och fysiska funktionsnedsättningar. Det består av ca 5000 grafiska symboler.
Lexikon blissymboler
Söderwall
Ordbok över svenska medeltidsspråket
Lexikon svenska
Ordstatistik för korpusar
Ackumulerad ordstatistik från många av våra moderna svenska korpusar
Korpus
Förtränade inbäddningar
En lista över förtränade inbäddningar för svenska
Modell svenska
Flerspråkigt Konstruktikon
Ett flerspråkigt konstruktikon
Lexikon svenska, ryska
Svensk analogi 2.0
Svensk semantisk och syntaktisk likhet
Korpus svenska
Samling
Kvinnotidningar
Material från äldre svenska kvinnotidskrifter
Korpus svenska
Samling
Flashback
Material från diskussionsforumet Flashback
Korpus svenska
Parole+
Svenskt PAROLE lexikon - En språkteknologisk resurs med syntaktisk information, partiellt länkad till betydelser i SALDO
Lexikon svenska
Samling
Fornsvenska textbankens material
En samling fornsvenska texter från Fornsvenska textbanken
Korpus svenska
Samling
SweLL-pilot
Uppsatser svrivna av vuxenstuderande i svenska, manuellt anonymiserade och annoterade med felkategorier. Korpusen innehåller både originaltexten och en normaliserad version av varje uppsats. Insamlingperiod 2006-2015.
Korpus svenska
Bring
Brings "Svenskt ordförråd ordnat i begreppsklasser" (1930) i digital version
Lexikon svenska
Söderwall Supplement
Ordbok över svenska medeltidsspråket
Lexikon svenska
DaLAJ-GED-Superlim 2.0
Dataset for Linguistic Acceptability Judgments (and more), v.2.0
Korpus svenska
Svenska historiska inbäddningar (word embeddings)
Förtränade inbäddningar (word embeddings) för historisk svenska
Modell svenska
Rysk Konstruktikon
Ett ryskt konstruktikon
Lexikon ryska, engelska
SweDN 1.0
A Swedish text summarization corpus
Korpus svenska
Samling
Göteborgsposten
En korpus med texter från Göteborgs-Posten
Korpus svenska
SALDO
SALDO är ett semantiskt och morfologiskt lexikon för modernt svenskt skriftspråk för språkteknologi.
Lexikon svenska
Argumentation sentences 1.0
A translated corpus for classifying sentence stance in relation to a topic.
Korpus svenska