Hoppa till huvudinnehåll

Språkresurser

Här kan du leta och filtrera bland våra korpusar och lexikon. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på Korp- eller Karp-ikonen kommer du direkt till gränssnittet där du kan utforska resursen.
Resurs Antal tokens Språk Åtkomst
Press 65
Svensk press 1965
1 119 449 svenska
Press 76
Svensk press 1976
1 348 122 svenska
Press 95
Svensk press 1995
7 671 700 svenska
Press 96
Svensk press 1996
6 516 030 svenska
Press 97
Svensk press 1997
13 703 279 svenska
Press 98
Svensk press 1998
10 740 849 svenska
Psalmboken (1937)
Psalmboken från 1937
163 574 svenska
Samling
Riksdagens öppna data
Data från data.riksdagen.se
svenska
Riksdagens öppna data: Anföranden
Alla riksdagens anföranden från och med riksmötet 1993/94 till och med riksmötet 2017/2018
121 987 537 svenska
Riksdagens öppna data: Betänkande
Utskottens betänkanden och utlåtanden, inklusive rksdagens beslut, en sammanfattning av voteringsresultaten och Beslut i korthet
203 229 298 svenska
Riksdagens öppna data: Departementsserien
Utredningar från regeringens departement
50 678 547 svenska
Riksdagens öppna data: EUN
Dokument från EU-nämnden, bland annat möteskallelser, föredragningslistor, protokoll och skriftliga samråd med regeringen
722 016 svenska
Riksdagens öppna data: Faktapromemoria
Regeringens faktapromemorior om EU-kommissionens förslag
3 373 261 svenska
Riksdagens öppna data: Föredragningslista
Föredragningslistor för kammarens sammanträden
842 042 svenska
Riksdagens öppna data: Framställning/redogörelse
Framställningar och redogörelser från organ som utsetts av riksdagen
18 044 760 svenska
Riksdagens öppna data: Interpellation
Interpellationer från ledamöterna till regeringen
25 969 006 svenska
Riksdagens öppna data: Kammaraktiviteter
6 298 451 svenska
Riksdagens öppna data: KOM
EU-kommissionens förslag och redogörelser, så kallade KOM-dokument
44 678 107 svenska
Riksdagens öppna data: Motion
Motioner från riksdagens ledamöter
162 923 798 svenska
Riksdagens öppna data: Övrigt
Dokumentserierna Riksrevisionens granskningsrapporter, Utredningar från Riksdagsförvaltningen och Rapporter från riksdagen samt planeringsdokument, bilagor till dokument och uttag ur riksdagens databaser och de gamla dokumentserierna Utredningar från riksdag
21 916 385 svenska
Riksdagens öppna data: Proposition
Propositioner och skrivelser från regeringen
379 103 550 svenska
Riksdagens öppna data: Protokoll
Protokoll från kammarens sammanträden
247 384 265 svenska
Riksdagens öppna data: Riksdagsskrivelse
Skrivelser från riksdagen till regeringen
236 335 svenska
Riksdagens öppna data: Sammanträden
87 453 svenska
Riksdagens öppna data: Skriftliga frågor
Skriftliga frågor från ledamöterna till regeringen och svaren på dessa
14 599 076 svenska
Riksdagens öppna data: Statens offentliga utredningar
Olika utredningars förslag till regeringen
273 083 646 svenska
Riksdagens öppna data: Talarlista
Talarlistor för kammarens sammanträden
320 875 svenska
Riksdagens öppna data: Utredningar
Kommittédirektiv och kommittéberättelser för utredningar som regeringen tillsätter
1 548 660 svenska
Riksdagens öppna data: Utskottsdokument
Dokument från utskotten, bland annat KU-anmälningar, protokoll, verksamhetsberättelser och den gamla dokumentserien Utredningar från riksdagen
5 865 972 svenska
Riksdagens öppna data: Yttrande
Utskottens yttranden
9 511 225 svenska
Rösträtt för kvinnor
Årgångarna 1912–1918 av tidskriften Rösträtt för kvinnor
1 873 503 svenska
SALT – svenska-nederländska
Nederländsk-svensk parallellkorpus av 1900-talet skön- och facklitterära texter.
2 845 857 svenska, nederländska
SAOB1950
Skannade böcker från 1950 till 2007 som används som källmaterial för att uppdatera SAOB, med ett urval som speglar det svenska ordförrådet under 1900-talet.
50 285 466 svenska
ScandiSent
Sentimentkorpus för svenska, norska, danska, finska och engelska, insamlad från trustpilot.
svenska, bokmål, danska, engelska, finska
SemEval2020 Task 1
Svensk testdata för SemEval 2020 Task 1: Unsupervised Lexical Semantic Change Detection (utdrag ur Kubhist v2)
182 000 000 svenska
Sibirientyska
Sibirientyska är nedtecknad talad tyska som talas idag av c:a 36 000 människor i regionen Krasnojarsk i Sibirien (Ryssland).
34 205 svenska
Sibirientyska kvinnor
Samtal med fyra kvinnor födda mellan 1927 och 1937 i sovjetiska Volgarepubliken
16 208 svenska
SIC2 - Stockholm Internet Corpus
Korpusen Stockholm Internet Corpus (SIC2) innehåller svenska bloggar som är annoterade med ordklasstaggar, morfologiska särdrag och namnentiteter.
13 562 svenska
Smittskydd
Smittskyddsinstitutets tidskrift Smittskydd, årgångarna 2002–2010
691 716 svenska
SNP 1978–79
Riksdagens snabbprotokoll 1978–1979
4 865 138 svenska
Samling
Somaliska korpusar
En samling av korpusar på somaliska
somali
Somaliska Wikipedia
Korpus av somaliska Wikipedia
869 335 somali
Somaliska: Af Soomaali 1971-79
50 794 somali
Somaliska: Af-Soomaali 2001 Somaliland
35 043 somali
Somaliska: Af-Soomaali 2001 Soomaaliya
129 947 somali
Somaliska: Afka Hooyo 2010–19 Iswiidhan
21 542 somali
Somaliska: Caafimaad 1972–79
13 550 somali
Somaliska: Cilmi-Afeed
190 429 somali
Somaliska: Cilmiga Bulshada 1971–1980
79 005 somali
Somaliska: Cilmiga Bulshada 2001-03 Soomaaliya
48 234 somali
Somaliska: Cilmiga Bulshada 2016 Somaliland
54 498 somali
Somaliska: Kitaabka Quduuska Ah
841 187 somali
Somaliska: Maaddooyinka Kale 1972–79
14 908 somali
Somaliska: Raadiyaha Denmark 2014
199 173 somali
Somaliska: Raadiyaha Iswiidhan 2014
235 911 somali
Somaliska: Saynis 1980–89
33 034 somali
Somaliska: Sheekooyin Carruureed
26 003 somali
Somaliska: Sheekooyin Carruureed (Turjuman)
13 865 somali
Somaliska: Sheekooyin Gaagaaban
180 852 somali
Somaliska: Suugaan
156 288 somali
Somaliska: Suugaan (Turjuman)
8 796 somali
Somaliska: Suugaan 2
2 827 328 somali
Somaliska: Taariikh iyo Dhaqan (Turjuman)
35 479 somali
Somaliska: Xisaab 2001 Soomaaliya
50 361 somali
Somaliska: Xisaab 2016 Somaliland
41 922 somali
SpIn v1
256 essays collected from Language Introduction course (mid-term exams) for newly arrived refugees. Some of the students are recurrent.
46 911 svenska
Språkprov SO 2009
De drygt 94 000 språkexemplen är hämtade ur Svensk ordbok utgiven av Svenska Akademien (2009). Exemplens uppgift är att stödja ordboksdefinitionerna och att ge information om uppslagsordens fraseologi. <br><br>För åtkomst kontakta <a href="mailto:emma.skoldberg@svenska.gu.se">Emma Sköldberg</a>.
541 568 svenska
Stockholms stads tänkeböcker
Protokoll och minnesanteckningar från Stockholms rådhusrätt, år 1626.
121 366 svenska
SUC 2.0
Stockholm-Umeå-korpus 2.0
1 166 593 svenska
SUC 3.0
Stockholm-Umeå-korpus 3.0
1 166 593 svenska
SUC-romaner (StorSUC)
Stockholm-Umeå-korpus
4 651 200 svenska
SUCX 2.0
Stockholm-Umeå-korpus 2.0 omkastad
1 166 593 svenska
SUCX 3.0
Stockholm-Umeå-korpus 3.0 omkastad
1 166 593 svenska
Samling
SuperLim 2
A standardized suite for evaluation and analysis of Swedish natural language understanding systems.
svenska
SuperSim (paketterat för Superlim) 2.0
En datamängd för betydelsemässig likhet och koppling mellan svenska ord.
svenska
sv-COVID-19
Blandade artiklar relaterade till coronaviruspandemin
8 130 201 svenska
Svensk ABSAbank
Svensk annoterad korpus för aspektbaserad attitydanalys
1 574 226 svenska
Svensk ABSAbank-Imm 1.1
Svensk annoterad korpus för aspektbaserad attitydanalys (en version av Absabank)
svenska
Svensk analogi 2.0
Svensk semantisk och syntaktisk likhet
svenska
Svensk EAT: frågeklassifikation
En översättning av QAQC datamängden för klassificering av typer av det förväntade svaret
svenska
Svensk författningssamling
Svensk författningssamling 1880-01-01 – 2012-08-16
8 058 400 svenska
Svensk fraktur 1626-1816
Ett urval av svensk fraktur texter tryckta mellan 1626 och 1816 från samlingarna på Universitetsbiblioteket vid Göteborgs universitet (UB). För OCR analys.
47 924 svenska
Svensk prosafiktion 1800–1900
All svensk skönlitteratur som trycktes första gången åren 1800, 1820, 1840, 1860, 1880 och 1900
16 275 130 svenska
Svensk Tidskrift
27 årgångar av den konservativa idétidskriften Svensk Tidskrift, mellan 1891 och 1940
7 202 567 svenska
Svensk trädbank
En svensk trädbank med återanvändning av existerande resurser
svenska
Svensk Twitter 2015
Material från ett urval av svenskspråkiga Twitteranvändare från 2015
412 663 140 svenska
Svensk Twitter 2016
Material från ett urval av svenskspråkiga Twitteranvändare från 2016
694 515 420 svenska
Svensk Twitter 2017
Material från ett urval av svenskspråkiga Twitteranvändare från 2017
505 017 012 svenska
Svenska partiprogram och valmanifest
De svenska partiernas partiprogram och valmanifest 1887–2022
2 099 602 svenska
Svenska tidningar 1818-1870
Ett urval av svenska tidningar tryckta mellan 1818 och 1870 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
186 013 svenska
Svenska tidningar 1871-1906
Ett urval av svenska tidningar tryckta mellan 1871 och 1906 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
337 635 svenska
Svenska Wikipedia
Korpus av svenskspråkiga Wikipedia
190 149 497 svenska
Svenskt frasnät (SweFN)
En lexikalisk-semantisk resurs baserad på samma principer som engelska Berkeley FrameNet. Denna del av resursen innehåller korpusexemplen, automatiskt annoterade med språklig information.
137 770 svenska
SveParafras 2.0
Referensdatan för semantisk textjämförelse (STS Benchmark)
svenska
Samling
SVT nyheter
Nyhetstexter från svt.se
svenska
SVT nyheter 2004
Nyhetstexter från svt.se
447 189 svenska
SVT nyheter 2005
Nyhetstexter från svt.se
3 300 646 svenska
SVT nyheter 2006
Nyhetstexter från svt.se
4 172 111 svenska
SVT nyheter 2007
Nyhetstexter från svt.se
5 533 682 svenska
SVT nyheter 2008
Nyhetstexter från svt.se
7 693 570 svenska