Hoppa till huvudinnehåll

Datamängder

Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden. Du kan göra avancerade sökningar i vår metadata hos Datacite.
Resurs Antal tokens Språk Åtkomst
Kvinnotidningar: Rösträtt för Kvinnor
En korpus med texter från kvinnotidningen Rösträtt för Kvinnor, tidning utgiven av landsföreningen för kvinnans politiska rösträtt
2 202 776 svenska
Kvinnotidningar: Tidevarvet
En korpus med texter från kvinnotidningen Tidevarvet
6 813 909 svenska
Lagar från 1800-talet
Regeringsformen 1809 med ändringar 1809-1974
446 438 svenska
Lawline
Frågor och svar kring juridisk rådgivning från lawline.
12 002 288 svenska
Samling
Learner Language
Learner Language är en samling av korpusar och lexikala resurser som beskriver inlärarspråket. Korpusar inkluderar både texter/audio som produceras av de som lär sig språket, och texter/språket som de utsätts för (läser eller hör, t.ex. kursböcker). Även en del derivata resurser utifrån dessa korpusar är med i denna samling.
svenska, flera språk
Likpredikningar från Skokloster slotts bibliotek
En digitaliserad samling av drygt 1000 tryckta likpredikningar från 1600- och 1700-talet.
21 134 svenska
Litteraturbanken: fria verk
E-texter och sökbara faksimiler från Litteraturbanken (litteraturbanken.se)
344 688 445 svenska
Litteraturbanken: skyddade verk
E-texter och sökbara faksimiler från Litteraturbanken (litteraturbanken.se)
128 261 903 svenska
Samling
Läkartidningen
Korpus för vårdens och omsorgens fackspråk
svenska
Läkartidningen 1996
Läkartidningens publicerade artiklar under 1996.
2 016 356 svenska
Läkartidningen 1997
Läkartidningens publicerade artiklar under 1997.
1 977 051 svenska
Läkartidningen 1998
Läkartidningens publicerade artiklar under 1998.
2 195 964 svenska
Läkartidningen 1999
Läkartidningens publicerade artiklar under 1999.
2 075 532 svenska
Läkartidningen 2000
Läkartidningens publicerade artiklar under 2000.
2 000 393 svenska
Läkartidningen 2001
Läkartidningens publicerade artiklar under 2001.
2 094 491 svenska
Läkartidningen 2002
Läkartidningens publicerade artiklar under 2002.
2 009 521 svenska
Läkartidningen 2003
Läkartidningens publicerade artiklar under 2003.
1 748 780 svenska
Läkartidningen 2004
Läkartidningens publicerade artiklar under 2004.
1 831 732 svenska
Läkartidningen 2005
Läkartidningens publicerade artiklar under 2005.
1 505 574 svenska
Läkartidningen 2006
Läkartidningens publicerade artiklar under 2006.
1 586 627 svenska
LäSBarT
Lättläst svenska och barnbokstext
1 129 083 svenska
MAÞiR Träd
En fornsvensk trädbank, med lemmata, ordklasser och syntax i stil med PROIEL-korpusarna.
33 721 svenska
Samling
Medeltidsbrev
Svenskt Diplomatariums huvudkartotek över medeltidsbreven (SDHK)
latin, tyska, norska, svenska
Medeltidsbrev: Svenska
Brev på svenska, ur Svenskt Diplomatariums huvudkartotek (SDHK)
967 228 svenska
Medeltidsbrev: Övriga språk
Brev på övriga språk, ur Svenskt Diplomatariums huvudkartotek (SDHK)
39 430 svenska
MEPAC bloggar
2 738 428 svenska
MEPAC intervjuer
331 998 svenska
MuClaGED
MuClaGED är en datamängd för multi-class Grammatical Error Detection för svenska. Den är baserad på SweLL-gold korpusen.
155 415 svenska
MultiGEC
MultiGEC är en datamängd för Grammatical Error Correction (uppgift inom NLP) och innehåller parallel data för 12 språk och 17 delkorpusar. Varje delkorpus består av två eller fler varianter av samma texter (oftast uppsatser som skrivs av språkinlärare), där en version (orig) har skrivits av en författare (elev, student, etc.) och de andra versionerna (ref1, ref2, ...) är korrigerade versioner av samma text. Språk som ingår: tjeckiska, engelska, estniska, tyska, grekiska, isländska, italienska, lettiska, ryska, slovenska, svenska och ukrainska (engelska och ryska kan fås på begäran). Texter kommer från olika ursprungskorpusar, men har genomgått omformattering för att ha en gemensam format.
tjeckiska, tyska, modern greek (1453-), engelska, estniska, isländska, italienska, lettiska, ryska, slovenska, svenska, ukrainska
MultiGED
MultiGED är en datamängd för Grammatical Error Detection (uppgift inom NLP) och innehåller data för 5 språk (tjeckiska, engelska, tyska, italienska och svenska).
tjeckiska, tyska, engelska, italienska, svenska
Nils Matsson Kiöpings resor
Reseskildringar från 1674 och 1743
76 209 svenska
Norstedtsromaner (1999)
En samling med 23 romaner utgivna 1999 på Norstedts förlag
2 533 209 svenska
NPEGL: Old Swedish
64 492 svenska
OpenEDGeS
En delmängd av korpusen EDGeS Diachronic Bible Corpus, som tillhandahålls under en publik licens. EDGeS är en diakron och synkron parallelkorpus med bibelöversättningar från 1300-talet till nutid.
19 399 149 svenska, engelska, tyska, nederländska
ORDAT
Svenska Dagbladets årsbok 1923–1958
1 528 935 svenska
PAROLE
En korpus annoterad med morfologisk och syntaktisk information
24 303 096 svenska
PGV-PII
En liten samling av 10 par parallella texter på svenska och engelska, annoterade med kategorier på personliga uppgifter.
22 589 svenska, engelska
Podiet
Artiklar från Konsertmagasinet Podiet
886 279 svenska
Poeter.se
Poesi från Poeter.se
132 687 599 svenska
Samling
Press
Svensk press
svenska
Press 65
Svensk press 1965
1 119 449 svenska
Press 76
Svensk press 1976
1 348 122 svenska
Press 95
Svensk press 1995
7 671 700 svenska
Press 96
Svensk press 1996
6 516 030 svenska
Press 97
Svensk press 1997
13 703 279 svenska
Press 98
Svensk press 1998
10 740 849 svenska
Psalmboken (1937)
Psalmboken från 1937
163 574 svenska
Samling
Riksdagens öppna data
Data från data.riksdagen.se
svenska
Riksdagens öppna data: Anföranden
Alla riksdagens anföranden från och med riksmötet 1993/94 till och med riksmötet 2017/2018
121 987 537 svenska
Riksdagens öppna data: Betänkande
Utskottens betänkanden och utlåtanden, inklusive rksdagens beslut, en sammanfattning av voteringsresultaten och Beslut i korthet
203 229 298 svenska
Riksdagens öppna data: Departementsserien
Utredningar från regeringens departement
50 678 547 svenska
Riksdagens öppna data: EUN
Dokument från EU-nämnden, bland annat möteskallelser, föredragningslistor, protokoll och skriftliga samråd med regeringen
722 016 svenska
Riksdagens öppna data: Faktapromemoria
Regeringens faktapromemorior om EU-kommissionens förslag
3 373 261 svenska
Riksdagens öppna data: Framställning/redogörelse
Framställningar och redogörelser från organ som utsetts av riksdagen
18 044 760 svenska
Riksdagens öppna data: Föredragningslista
Föredragningslistor för kammarens sammanträden
842 042 svenska
Riksdagens öppna data: Interpellation
Interpellationer från ledamöterna till regeringen
25 969 006 svenska
Riksdagens öppna data: Kammaraktiviteter
6 298 451 svenska
Riksdagens öppna data: KOM
EU-kommissionens förslag och redogörelser, så kallade KOM-dokument
44 678 107 svenska
Riksdagens öppna data: Motion
Motioner från riksdagens ledamöter
162 923 798 svenska
Riksdagens öppna data: Proposition
Propositioner och skrivelser från regeringen
379 103 550 svenska
Riksdagens öppna data: Protokoll
Protokoll från kammarens sammanträden
247 384 265 svenska
Riksdagens öppna data: Riksdagsskrivelse
Skrivelser från riksdagen till regeringen
236 335 svenska
Riksdagens öppna data: Sammanträden
87 453 svenska
Riksdagens öppna data: Skriftliga frågor
Skriftliga frågor från ledamöterna till regeringen och svaren på dessa
14 599 076 svenska
Riksdagens öppna data: Statens offentliga utredningar
Olika utredningars förslag till regeringen
273 083 646 svenska
Riksdagens öppna data: Talarlista
Talarlistor för kammarens sammanträden
320 875 svenska
Riksdagens öppna data: Utredningar
Kommittédirektiv och kommittéberättelser för utredningar som regeringen tillsätter
1 548 660 svenska
Riksdagens öppna data: Utskottsdokument
Dokument från utskotten, bland annat KU-anmälningar, protokoll, verksamhetsberättelser och den gamla dokumentserien Utredningar från riksdagen
5 865 972 svenska
Riksdagens öppna data: Yttrande
Utskottens yttranden
9 511 225 svenska
Riksdagens öppna data: Övrigt
Dokumentserierna Riksrevisionens granskningsrapporter, Utredningar från Riksdagsförvaltningen och Rapporter från riksdagen samt planeringsdokument, bilagor till dokument och uttag ur riksdagens databaser och de gamla dokumentserierna Utredningar från riksdag
21 916 385 svenska
Rösträtt för kvinnor
Årgångarna 1912–1918 av tidskriften Rösträtt för kvinnor
1 873 503 svenska
SALT – svenska-nederländska
Nederländsk-svensk parallellkorpus av 1900-talet skön- och facklitterära texter.
2 845 857 svenska, nederländska
SAOB1950
Skannade böcker från 1950 till 2007 som används som källmaterial för att uppdatera SAOB, med ett urval som speglar det svenska ordförrådet under 1900-talet.
50 285 466 svenska
ScandiSent
Sentimentkorpus för svenska, norska, danska, finska och engelska, insamlad från trustpilot.
svenska, bokmål, danska, engelska, finska
Segregationstexter: Göteborgs stad: Budgetar
1 659 609 svenska
Segregationstexter: Göteborgs stad: Interpellationer
106 118 svenska
Segregationstexter: Göteborgs stad: Kontor/förvaltningar
756 756 svenska
Segregationstexter: Göteborgs stad: Motioner
176 307 svenska
Segregationstexter: Göteborgs stad: Nämnder
367 615 svenska
Segregationstexter: Göteborgs stad: Rapporter
668 287 svenska
Segregationstexter: Göteborgs stad: Yrkanden
216 417 svenska
Segregationstexter: Göteborgs stad: Yttranden
223 857 svenska
Segregationstexter: Media: Kommunal informationstidning
60 191 svenska
Segregationstexter: Riksdagens öppna data: Betänkande
Utskottens betänkanden och utlåtanden, inklusive riksdagens beslut, en sammanfattning av voteringsresultaten och Beslut i korthet
26 706 890 svenska
Segregationstexter: Riksdagens öppna data: Departementsserien
Utredningar från regeringens departement
6 820 996 svenska
Segregationstexter: Riksdagens öppna data: EUN
Dokument från EU-nämnden, bland annat möteskallelser, föredragningslistor, protokoll och skriftliga samråd med regeringen
3 703 svenska
Segregationstexter: Riksdagens öppna data: Faktapromemoria
Regeringens faktapromemorior om EU-kommissionens förslag
18 678 svenska
Segregationstexter: Riksdagens öppna data: Framställning/redogörelse
Framställningar och redogörelser från organ som utsetts av riksdagen
1 316 348 svenska
Segregationstexter: Riksdagens öppna data: Föredragningslista
Föredragningslistor för kammarens sammanträden
5 149 svenska
Segregationstexter: Riksdagens öppna data: Interpellation
Interpellationer från ledamöterna till regeringen
948 204 svenska
Segregationstexter: Riksdagens öppna data: Kammaraktiviteter
1 953 686 svenska
Segregationstexter: Riksdagens öppna data: KOM
EU-kommissionens förslag och redogörelser, så kallade KOM-dokument
1 962 097 svenska
Segregationstexter: Riksdagens öppna data: Motion
Motioner från riksdagens ledamöter
16 208 509 svenska
Segregationstexter: Riksdagens öppna data: Proposition
Propositioner och skrivelser från regeringen
35 480 771 svenska
Segregationstexter: Riksdagens öppna data: Protokoll
Protokoll från kammarens sammanträden
57 270 162 svenska
Segregationstexter: Riksdagens öppna data: Skriftliga frågor
Skriftliga frågor från ledamöterna till regeringen och svaren på dessa
139 993 svenska
Segregationstexter: Riksdagens öppna data: Statens offentliga utredningar
Olika utredningars förslag till regeringen
66 695 400 svenska
Segregationstexter: Riksdagens öppna data: Utredningar
Kommittédirektiv och kommittéberättelser för utredningar som regeringen tillsätter
4 121 svenska
Segregationstexter: Riksdagens öppna data: Utskottsdokument
Dokument från utskotten, bland annat KU-anmälningar, protokoll, verksamhetsberättelser och den gamla dokumentserien Utredningar från riksdagen
65 746 svenska
Segregationstexter: Riksdagens öppna data: Yttrande
Utskottens yttranden
669 769 svenska
BibTeX list