Skip to main content

Language resources

On this page you can browse and search our corpora and lexicons. Click on a resource name to see what files are available for download. You can go directly to the search interface by clicking on the Korp or Karp logo.
Resource Sort ascending Type Language Access
SUCX 3.0
Stockholm-Umeå corpus 3.0 scrambled
Corpus Swedish
SUCX 2.0
Stockholm-Umeå corpus 2.0 scrambled
Corpus Swedish
SUC Novels (StorSUC)
Stockholm-Umeå corpus
Corpus Swedish
SUC 3.0
Stockholm-Umeå corpus 3.0
Corpus Swedish
SUC 2.0
Stockholm-Umeå corpus 2.0
Corpus Swedish
Språkprov SO 2009
De drygt 94 000 språkexemplen är hämtade ur Svensk ordbok utgiven av Svenska Akademien (2009). Exemplens uppgift är att stödja ordboksdefinitionerna och att ge information om uppslagsordens fraseologi. <br><br>För åtkomst kontakta <a href="mailto:emma.skoldberg@svenska.gu.se">Emma Sköldberg</a>.
Corpus Swedish
Sports anglicisms
English loan-words in the Swedish sports press
Lexicon Swedish
SpIn v1
256 essays collected from Language Introduction course (mid-term exams) for newly arrived refugees. Some of the students are recurrent.
Corpus Swedish
Somali: Xisaab 2016 Somaliland
Corpus Somali
Somali: Xisaab 2001 Soomaaliya
Corpus Somali
Somali: Taariikh iyo Dhaqan (Turjuman)
Corpus Somali
Somali: Suugaan 2
Corpus Somali
Somali: Suugaan (Turjuman)
Corpus Somali
Somali: Suugaan
Corpus Somali
Somali: Sheekooyin Gaagaaban
Corpus Somali
Somali: Sheekooyin Carruureed (Turjuman)
Corpus Somali
Somali: Sheekooyin Carruureed
Corpus Somali
Somali: Saynis 1980–89
Corpus Somali
Somali: Raadiyaha Iswiidhan 2014
Corpus Somali
Somali: Raadiyaha Denmark 2014
Corpus Somali
Somali: Maaddooyinka Kale 1972–79
Corpus Somali
Somali: Kitaabka Quduuska Ah
Corpus Somali
Somali: Cilmiga Bulshada 2016 Somaliland
Corpus Somali
Somali: Cilmiga Bulshada 2001-03 Soomaaliya
Corpus Somali
Somali: Cilmiga Bulshada 1971–1980
Corpus Somali
Somali: Cilmi-Afeed
Corpus Somali
Somali: Caafimaad 1972–79
Corpus Somali
Somali: Afka Hooyo 2010–19 Iswiidhan
Corpus Somali
Somali: Af-Soomaali 2001 Soomaaliya
Corpus Somali
Somali: Af-Soomaali 2001 Somaliland
Corpus Somali
Somali: Af Soomaali 1971-79
Corpus Somali
Somali Wikipedia
Corpus of Somali Wikipedia
Corpus Somali
Collection
Somali corpora
A collection of Samli corpora
Corpus Somali
Söderwall Supplement
Dictionary of Old Swedish
Lexicon Swedish
Söderwall
Dictionary of Old Swedish
Lexicon Swedish
SNP 1978–79
Swedish parliament proceedings 1978–1979
Corpus Swedish
Smittskydd
The newspaper Smittskydd by Smittskyddsinstitutet (Swedish Institute for Communicable Disease Control) 2002–2010
Corpus Swedish
SKBL
The Biographical Dictionary of Swedish Women
Lexicon Swedish, English
Simple+
The Swedish SIMPLE Lexicon - A language technology resource with access to semantic information in Swedish, connected to SALDO senses
Lexicon Swedish
Simple lexicon
The Swedish SIMPLE Lexicon - A language technology resource with access to semantic information in Swedish
Lexicon Swedish
SIC2 - Stockholm Internet Corpus
The Stockholm Internet Corpus (SIC2) contains Swedish blog posts, annotated with part of speech, morphological features, and named entities.
Corpus Swedish
Sibirientyska kvinnor
Dialogs between four women born in 1927 to 1937 in the Soviet Volga Republic
Corpus Swedish
Sibirian-German
Siberian German is transcribed German spoken of about 36 000 people in the region of Krasnoyarsk in Siberia (Russia).
Corpus Swedish
Sentiment Lexicon
Sentiment lexicon for Swedish based on SALDO
Lexicon Swedish
SenSALDO
SenSALDO, SALDO entries and text word forms with sentiment information (prior polarity)
Lexicon Swedish
SemEval2020 Task 1
Swedish Test Data for SemEval 2020 Task 1: Unsupervised Lexical Semantic Change Detection (extracts from Kubhist v2)
Corpus Swedish
Schlyter
Dictionary of Old Swedish
Lexicon Swedish
ScandiSent
Sentiment Corpus for Swedish, Norwegian, Danish, Finnish and English crawled from trustpilot.
Corpus Swedish, Norwegian Bokmål, Danish, English, Finnish
SAOB1950
Scanned books from 1950 to 2007 that are used as source material for updating SAOB, with a selection that reflects the Swedish vocabulary during the 20th century.
Corpus Swedish
SALT – Swedish-Dutch
Dutch-Swedish parallel corpus of 20th century fictional and nonfictional texts.
Corpus Swedish, Dutch
SALDO: examples
Example sentences for senses in SALDO
Lexicon Swedish
SALDO's morphology
Semantic and morphological lexicon for language technology
Lexicon Swedish
SALDO
SALDO is an extensive lexicon resource for modern Swedish written language.
Lexicon Swedish
Russian Constructicon
A Russian Constructicon
Lexicon Russian, English
Rösträtt för kvinnor
Annual volumes 1912–1918 of the journal Rösträtt för kvinnor
Corpus Swedish
Riksdagens öppna data: Yttrande
Utskottens yttranden
Corpus Swedish
Riksdagens öppna data: Utskottsdokument
Dokument från utskotten, bland annat KU-anmälningar, protokoll, verksamhetsberättelser och den gamla dokumentserien Utredningar från riksdagen
Corpus Swedish
Riksdagens öppna data: Utredningar
Kommittédirektiv och kommittéberättelser för utredningar som regeringen tillsätter
Corpus Swedish
Riksdagens öppna data: Talarlista
Talarlistor för kammarens sammanträden
Corpus Swedish
Riksdagens öppna data: Statens offentliga utredningar
Olika utredningars förslag till regeringen
Corpus Swedish
Riksdagens öppna data: Skriftliga frågor
Skriftliga frågor från ledamöterna till regeringen och svaren på dessa
Corpus Swedish
Riksdagens öppna data: Sammanträden
Corpus Swedish
Riksdagens öppna data: Riksdagsskrivelse
Skrivelser från riksdagen till regeringen
Corpus Swedish
Riksdagens öppna data: Protokoll
Protokoll från kammarens sammanträden
Corpus Swedish
Riksdagens öppna data: Proposition
Propositioner och skrivelser från regeringen
Corpus Swedish
Riksdagens öppna data: Övrigt
Dokumentserierna Riksrevisionens granskningsrapporter, Utredningar från Riksdagsförvaltningen och Rapporter från riksdagen samt planeringsdokument, bilagor till dokument och uttag ur riksdagens databaser och de gamla dokumentserierna Utredningar från riksdag
Corpus Swedish
Riksdagens öppna data: Motion
Motioner från riksdagens ledamöter
Corpus Swedish
Riksdagens öppna data: KOM
EU-kommissionens förslag och redogörelser, så kallade KOM-dokument
Corpus Swedish
Riksdagens öppna data: Kammaraktiviteter
Corpus Swedish
Riksdagens öppna data: Interpellation
Interpellationer från ledamöterna till regeringen
Corpus Swedish
Riksdagens öppna data: Framställning/redogörelse
Framställningar och redogörelser från organ som utsetts av riksdagen
Corpus Swedish
Riksdagens öppna data: Föredragningslista
Föredragningslistor för kammarens sammanträden
Corpus Swedish
Riksdagens öppna data: Faktapromemoria
Regeringens faktapromemorior om EU-kommissionens förslag
Corpus Swedish
Riksdagens öppna data: EUN
Dokument från EU-nämnden, bland annat möteskallelser, föredragningslistor, protokoll och skriftliga samråd med regeringen
Corpus Swedish
Riksdagens öppna data: Departementsserien
Utredningar från regeringens departement
Corpus Swedish
Riksdagens öppna data: Betänkande
Utskottens betänkanden och utlåtanden, inklusive rksdagens beslut, en sammanfattning av voteringsresultaten och Beslut i korthet
Corpus Swedish
Collection
Riksdagens öppna data
Data from the Swedish parliament collected from data.riksdagen.se
Corpus Swedish
Questions and answers about the Swedish language
Counselling mails of the Language Council of Sweden
Corpus Swedish
Psalm book (1937)
The Swedish psalm book from 1937
Corpus Swedish
Pretrained embeddings
A list of pretrained embeddings for Swedish
Model Swedish
Press 98
Swedish press 1998
Corpus Swedish
Press 97
Swedish press 1997
Corpus Swedish
Press 96
Swedish press 1996
Corpus Swedish
Press 95
Swedish press 1995
Corpus Swedish
Press 76
Swedish press 1976
Corpus Swedish
Press 65
Swedish press 1965
Corpus Swedish
Collection
Press
Swedish press
Corpus Swedish
Preperatory work 1734
Material från lagkommissionen till 1734 års lag
Corpus Swedish
POS-tagging model: Stanza
Pretrained models for POS-tagging.
Model Swedish
POS-tagging model: Marmot
Pretrained models for POS-tagging.
Model Swedish
POS-tagging model: Flair
Pretrained models for POS-tagging.
Model Swedish
Podiet
Articles from the consert magazine Podiet
Corpus Swedish
Parole+
The Swedish PAROLE Lexicon - A language technology resource with access to syntactic information, partially linked to SALDO senses
Lexicon Swedish
Parole
The Swedish PAROLE Lexicon - A language technology resource with access to syntactic information
Lexicon Swedish
PAROLE
A corpus annotated with morphological and syntactic information
Corpus Swedish
OSA (SAOB)
The Swedish Academy Dictionary online
Lexicon Swedish
ORDAT
Yearbook of Svenska Dagbladet 1923–1958
Corpus Swedish
Oral Copus for Reference of Contemporary Spanish
Corpus with transcriptions from recorded audio tapes from 1991 to 1992. Part of SOL - Spanish Online
Corpus Spanish
OpenEDGeS
The public license subset of the EDGeS Diachronic Bible Corpus, a diachronically and synchronically parallel corpus of Bible translations in Dutch,English, German and Swedish, with texts from the 14th century until today.
Corpus Swedish, English, German, Dutch
Older Swedish novels
A collection of more than 50 older Swedish novels by 14 different authors
Corpus Swedish