Skip to main content

Language resources

On this page you can browse and search our corpora and lexicons. Click on a resource name to see what files are available for download. You can go directly to the search interface by clicking on the Korp or Karp logo.
Resource Tokens Language Access
Old Finland Swedish: Protokoll vid lantdagen i Borgå år 1809
Part of the Finland Swedish language bank over Swedish in Finland today and yesterday
472,093 Swedish
Old Finland Swedish: Spanska Flugan 1839–1841
Part of the Finland Swedish language bank over Swedish in Finland today and yesterday
41,935 Swedish
Old Finland Swedish: Tidningar Utgifne af et Sällskap i Åbo 1771–1783
Part of the Finland Swedish language bank over Swedish in Finland today and yesterday
6,532 Swedish
Old Finland Swedish: Typografiskt minnesblad 1891
Part of the Finland Swedish language bank over Swedish in Finland today and yesterday
10,234 Swedish
Old Finland Swedish: Typograftidning 1889–1890
Part of the Finland Swedish language bank over Swedish in Finland today and yesterday
63,394 Swedish
Old Finland Swedish: Uleåborgs Tidning 1877–1887
Part of the Finland Swedish language bank over Swedish in Finland today and yesterday
13,474 Swedish
Old Finland Swedish: Wasabladet 1866–1896
Part of the Finland Swedish language bank over Swedish in Finland today and yesterday
69,695 Swedish
Old Finland Swedish: Wiborgs Tidning 1867–1877
Part of the Finland Swedish language bank over Swedish in Finland today and yesterday
19,086 Swedish
Older Swedish novels
A collection of more than 50 older Swedish novels by 14 different authors
4,347,047 Swedish
OpenEDGeS
The public license subset of the EDGeS Diachronic Bible Corpus, a diachronically and synchronically parallel corpus of Bible translations in Dutch,English, German and Swedish, with texts from the 14th century until today.
19,399,149 Swedish, English, German, Dutch
Oral Copus for Reference of Contemporary Spanish
Corpus with transcriptions from recorded audio tapes from 1991 to 1992. Part of SOL - Spanish Online
1,200,830 Spanish
ORDAT
Yearbook of Svenska Dagbladet 1923–1958
1,528,935 Swedish
PAROLE
A corpus annotated with morphological and syntactic information
24,303,096 Swedish
Podiet
Articles from the consert magazine Podiet
651,150 Swedish
Poeter.se
Poetry from Poeter.se
106,196,502 Swedish
Preperatory work 1734
Material från lagkommissionen till 1734 års lag
1,603,126 Swedish
Collection
Press
Swedish press
Swedish
Press 65
Swedish press 1965
1,119,449 Swedish
Press 76
Swedish press 1976
1,348,122 Swedish
Press 95
Swedish press 1995
7,671,700 Swedish
Press 96
Swedish press 1996
6,516,030 Swedish
Press 97
Swedish press 1997
13,703,279 Swedish
Press 98
Swedish press 1998
10,740,849 Swedish
Psalm book (1937)
The Swedish psalm book from 1937
163,574 Swedish
Questions and answers about the Swedish language
Counselling mails of the Language Council of Sweden
20,083,415 Swedish
Collection
Riksdag of the Estates
Collection of textual documents from the Swedish Riksdag of the Estates
Swedish
Riksdag of the Estates: Adelsståndet
Part of the data set "Riksdag of the Estates"
64,915,391 Swedish
Riksdag of the Estates: Bihang m.m.
Part of the data set "Riksdag of the Estates"
66,201,274 Swedish
Riksdag of the Estates: Bondeståndet
Part of the data set "Riksdag of the Estates"
32,884,985 Swedish
Riksdag of the Estates: Borgarståndet
Part of the data set "Riksdag of the Estates"
35,604,839 Swedish
Riksdag of the Estates: Prästeståndet
Part of the data set "Riksdag of the Estates"
30,653,241 Swedish
Riksdag of the Estates: Riksdagsakter
Part of the data set "Riksdag of the Estates"
4,052,160 Swedish
Riksdag of the Estates: Riksdagsbeslut
Part of the data set "Riksdag of the Estates"
355,722 Swedish
Collection
Riksdagens öppna data
Data from the Swedish parliament collected from data.riksdagen.se
Swedish
Riksdagens öppna data: Betänkande
Utskottens betänkanden och utlåtanden, inklusive rksdagens beslut, en sammanfattning av voteringsresultaten och Beslut i korthet
203,229,298 Swedish
Riksdagens öppna data: Departementsserien
Utredningar från regeringens departement
50,678,547 Swedish
Riksdagens öppna data: EUN
Dokument från EU-nämnden, bland annat möteskallelser, föredragningslistor, protokoll och skriftliga samråd med regeringen
722,016 Swedish
Riksdagens öppna data: Faktapromemoria
Regeringens faktapromemorior om EU-kommissionens förslag
3,373,261 Swedish
Riksdagens öppna data: Föredragningslista
Föredragningslistor för kammarens sammanträden
842,042 Swedish
Riksdagens öppna data: Framställning/redogörelse
Framställningar och redogörelser från organ som utsetts av riksdagen
18,044,760 Swedish
Riksdagens öppna data: Interpellation
Interpellationer från ledamöterna till regeringen
25,969,006 Swedish
Riksdagens öppna data: Kammaraktiviteter
6,298,451 Swedish
Riksdagens öppna data: KOM
EU-kommissionens förslag och redogörelser, så kallade KOM-dokument
44,678,107 Swedish
Riksdagens öppna data: Motion
Motioner från riksdagens ledamöter
162,923,798 Swedish
Riksdagens öppna data: Övrigt
Dokumentserierna Riksrevisionens granskningsrapporter, Utredningar från Riksdagsförvaltningen och Rapporter från riksdagen samt planeringsdokument, bilagor till dokument och uttag ur riksdagens databaser och de gamla dokumentserierna Utredningar från riksdag
21,916,385 Swedish
Riksdagens öppna data: Proposition
Propositioner och skrivelser från regeringen
379,103,550 Swedish
Riksdagens öppna data: Protokoll
Protokoll från kammarens sammanträden
247,384,265 Swedish
Riksdagens öppna data: Riksdagsskrivelse
Skrivelser från riksdagen till regeringen
236,335 Swedish
Riksdagens öppna data: Sammanträden
87,453 Swedish
Riksdagens öppna data: Skriftliga frågor
Skriftliga frågor från ledamöterna till regeringen och svaren på dessa
14,599,076 Swedish
Riksdagens öppna data: Statens offentliga utredningar
Olika utredningars förslag till regeringen
273,083,646 Swedish
Riksdagens öppna data: Talarlista
Talarlistor för kammarens sammanträden
320,875 Swedish
Riksdagens öppna data: Utredningar
Kommittédirektiv och kommittéberättelser för utredningar som regeringen tillsätter
1,548,660 Swedish
Riksdagens öppna data: Utskottsdokument
Dokument från utskotten, bland annat KU-anmälningar, protokoll, verksamhetsberättelser och den gamla dokumentserien Utredningar från riksdagen
5,865,972 Swedish
Riksdagens öppna data: Yttrande
Utskottens yttranden
9,511,225 Swedish
Rösträtt för kvinnor
Annual volumes 1912–1918 of the journal Rösträtt för kvinnor
1,873,503 Swedish
SALT – Swedish-Dutch
Dutch-Swedish parallel corpus of 20th century fictional and nonfictional texts.
2,845,857 Swedish, Dutch
SAOB1950
Scanned books from 1950 to 2007 that are used as source material for updating SAOB, with a selection that reflects the Swedish vocabulary during the 20th century.
50,285,466 Swedish
ScandiSent
Sentiment Corpus for Swedish, Norwegian, Danish, Finnish and English crawled from trustpilot.
Swedish, Norwegian Bokmål, Danish, English, Finnish
SemEval2020 Task 1
Swedish Test Data for SemEval 2020 Task 1: Unsupervised Lexical Semantic Change Detection (extracts from Kubhist v2)
182,000,000 Swedish
Sibirian-German
Siberian German is transcribed German spoken of about 36 000 people in the region of Krasnoyarsk in Siberia (Russia).
34,205 Swedish
Sibirientyska kvinnor
Dialogs between four women born in 1927 to 1937 in the Soviet Volga Republic
16,208 Swedish
SIC2 - Stockholm Internet Corpus
The Stockholm Internet Corpus (SIC2) contains Swedish blog posts, annotated with part of speech, morphological features, and named entities.
13,562 Swedish
Smittskydd
The newspaper Smittskydd by Smittskyddsinstitutet (Swedish Institute for Communicable Disease Control) 2002–2010
691,716 Swedish
SNP 1978–79
Swedish parliament proceedings 1978–1979
4,865,138 Swedish
Collection
Somali corpora
A collection of Samli corpora
Somali
Somali Wikipedia
Corpus of Somali Wikipedia
869,335 Somali
Somali: Af Soomaali 1971-79
50,794 Somali
Somali: Af-Soomaali 2001 Somaliland
35,043 Somali
Somali: Af-Soomaali 2001 Soomaaliya
129,947 Somali
Somali: Afka Hooyo 2010–19 Iswiidhan
21,542 Somali
Somali: Caafimaad 1972–79
13,550 Somali
Somali: Cilmi-Afeed
190,429 Somali
Somali: Cilmiga Bulshada 1971–1980
79,005 Somali
Somali: Cilmiga Bulshada 2001-03 Soomaaliya
48,234 Somali
Somali: Cilmiga Bulshada 2016 Somaliland
54,498 Somali
Somali: Kitaabka Quduuska Ah
841,187 Somali
Somali: Maaddooyinka Kale 1972–79
14,908 Somali
Somali: Raadiyaha Denmark 2014
199,173 Somali
Somali: Raadiyaha Iswiidhan 2014
235,911 Somali
Somali: Saynis 1980–89
33,034 Somali
Somali: Sheekooyin Carruureed
26,003 Somali
Somali: Sheekooyin Carruureed (Turjuman)
13,865 Somali
Somali: Sheekooyin Gaagaaban
180,852 Somali
Somali: Suugaan
156,288 Somali
Somali: Suugaan (Turjuman)
8,796 Somali
Somali: Suugaan 2
2,827,328 Somali
Somali: Taariikh iyo Dhaqan (Turjuman)
35,479 Somali
Somali: Xisaab 2001 Soomaaliya
50,361 Somali
Somali: Xisaab 2016 Somaliland
41,922 Somali
SpIn v1
256 essays collected from Language Introduction course (mid-term exams) for newly arrived refugees. Some of the students are recurrent.
46,911 Swedish
Språkprov SO 2009
De drygt 94 000 språkexemplen är hämtade ur Svensk ordbok utgiven av Svenska Akademien (2009). Exemplens uppgift är att stödja ordboksdefinitionerna och att ge information om uppslagsordens fraseologi. <br><br>För åtkomst kontakta <a href="mailto:emma.skoldberg@svenska.gu.se">Emma Sköldberg</a>.
541,568 Swedish
SUC 2.0
Stockholm-Umeå corpus 2.0
1,166,593 Swedish
SUC 3.0
Stockholm-Umeå corpus 3.0
1,166,593 Swedish
SUC Novels (StorSUC)
Stockholm-Umeå corpus
4,651,200 Swedish
SUCX 2.0
Stockholm-Umeå corpus 2.0 scrambled
1,166,593 Swedish
SUCX 3.0
Stockholm-Umeå corpus 3.0 scrambled
1,166,593 Swedish
Collection
SuperLim 2
A standardized suite for evaluation and analysis of Swedish natural language understanding systems.
Swedish
SuperSim (repackaged for Superlim) 2.0
A dataset for word similarity and relatedness in Swedish
Swedish
sv-COVID-19
A compilation of various articles related to the COVID-19 pandemic
8,130,201 Swedish