Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Datamängder

Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden.
Resurs Typ Språk Åtkomst
Kubord-fasttext - Aftonbladet 2010–2022 - lemma
Fasttext-modell tränad på Aftonbladet 2010–2022
Modell svenska
Kubord-fasttext - Aftonbladet 2010–2022 - token
Fasttext-modell tränad på Aftonbladet 2010–2022
Modell svenska
Kubord-fasttext - Dagens Nyheter 2010–2022 - lemma
Fasttext-modell tränad på Dagens Nyheter 2010–2022
Modell svenska
Kubord-fasttext - Dagens Nyheter 2010–2022 - token
Fasttext-modell tränad på Dagens Nyheter 2010–2022
Modell svenska
Kubord-fasttext - Göteborgsposten 2013–2022 - lemma
Fasttext-modell tränad på Göteborgsposten 2013–2022
Modell svenska
Kubord-fasttext - Göteborgsposten 2013–2022 - token
Fasttext-modell tränad på Göteborgsposten 2013–2022
Modell svenska
KVAH
Kungl. Vetenskapsakademiens Handlingar
Korpus svenska
Samling
Kvinnotidningar
Material från äldre svenska kvinnotidskrifter
Korpus svenska
Kvinnotidningar: Dagny
En korpus med texter från kvinnotidningen Dagny, tidskrift för sociala och literära intressen - utgiven av Frederika-Bremer-Förbundet
Korpus svenska
Kvinnotidningar: Hertha
En korpus med texter från kvinnotidningen Hertha, tidskrift för den svenska kvinnorörelsen - utgiven av Fredrika-Bremer-Förbundet
Korpus svenska
Kvinnotidningar: Idun
En korpus med texter från kvinnotidningen Idun, praktisk veckotidning för kvinnan och hemmet
Korpus svenska
Kvinnotidningar: Kvinnornas Tidning
En korpus med texter från Kvinnornas Tidning
Korpus svenska
Kvinnotidningar: Morgonbris
En korpus med texter från kvinnotidningen Morgonbris, arbeterskornas tidning - utgiven av kvinnornas fackförbund
Korpus svenska
Kvinnotidningar: Rösträtt för Kvinnor
En korpus med texter från kvinnotidningen Rösträtt för Kvinnor, tidning utgiven av landsföreningen för kvinnans politiska rösträtt
Korpus svenska
Kvinnotidningar: Tidevarvet
En korpus med texter från kvinnotidningen Tidevarvet
Korpus svenska
Lagar från 1800-talet
Regeringsformen 1809 med ändringar 1809-1974
Korpus svenska
Samling
Läkartidningen
Korpus för vårdens och omsorgens fackspråk
Korpus svenska
Läkartidningen 1996
Läkartidningens publicerade artiklar under 1996.
Korpus svenska
Läkartidningen 1997
Läkartidningens publicerade artiklar under 1997.
Korpus svenska
Läkartidningen 1998
Läkartidningens publicerade artiklar under 1998.
Korpus svenska
Läkartidningen 1999
Läkartidningens publicerade artiklar under 1999.
Korpus svenska
Läkartidningen 2000
Läkartidningens publicerade artiklar under 2000.
Korpus svenska
Läkartidningen 2001
Läkartidningens publicerade artiklar under 2001.
Korpus svenska
Läkartidningen 2002
Läkartidningens publicerade artiklar under 2002.
Korpus svenska
Läkartidningen 2003
Läkartidningens publicerade artiklar under 2003.
Korpus svenska
Läkartidningen 2004
Läkartidningens publicerade artiklar under 2004.
Korpus svenska
Läkartidningen 2005
Läkartidningens publicerade artiklar under 2005.
Korpus svenska
Läkartidningen 2006
Läkartidningens publicerade artiklar under 2006.
Korpus svenska
LäSBarT
Lättläst svenska och barnbokstext
Korpus svenska
Lawline
Frågor och svar kring juridisk rådgivning från lawline.
Korpus svenska
Samling
Learner Language
Learner Language är en samling av korpusar och lexikala resurser som beskriver inlärarspråket. Korpusar inkluderar både texter/audio som produceras av de som lär sig språket, och texter/språket som de utsätts för (läser eller hör, t.ex. kursböcker). Även en del derivata resurser utifrån dessa korpusar är med i denna samling.
Korpus svenska, flera språk
Lemmatiseringsmodell: Stanza
Förtränad modell för lemmatisering.
Modell svenska
LingFN
Ett domänspecifikt frasnät med lingvistiska termer
Lexikon svenska
LingFN-thesis
Ett domänspecifikt frasnät med lingvistiska termer
Lexikon svenska
LingFN-V2
Ett domänspecifikt frasnät med lingvistiska termer
Lexikon svenska
Linguistic Survey of India (LSI)
Korpus engelska
Litteraturbanken: fria verk
E-texter och sökbara faksimiler från Litteraturbanken (litteraturbanken.se)
Korpus svenska
Litteraturbanken: skyddade verk
E-texter och sökbara faksimiler från Litteraturbanken (litteraturbanken.se)
Korpus svenska
lsilex
Ett lexikon framtaget inom LSI-projektet
Lexikon svenska
LWT
Lånordstypologi
Lexikon svenska, engelska
LWT-PWN
LWT-PWN är IDS/LWT-begreppslistan med länkar till ordbetydelseidentifierare i Princeton WordNet 3.0.
Lexikon svenska
MAÞiR Ord
Fornsvensk lexikal resurs baserad på Söderwalls ordbok, lämpligt för bl a konstruktion av lemmatiseringsmodeller.
Lexikon svenska
MAÞiR Träd
En fornsvensk trädbank, med lemmata, ordklasser och syntax i stil med PROIEL-korpusarna.
Korpus svenska
Samling
Medeltidsbrev
Svenskt Diplomatariums huvudkartotek över medeltidsbreven (SDHK)
Korpus latin, tyska, norska, svenska
Medeltidsbrev: Latin
Brev på latin, ur Svenskt Diplomatariums huvudkartotek (SDHK)
Korpus latin
Medeltidsbrev: Norska
Brev på norska, ur Svenskt Diplomatariums huvudkartotek (SDHK)
Korpus norska
Medeltidsbrev: Övriga språk
Brev på övriga språk, ur Svenskt Diplomatariums huvudkartotek (SDHK)
Korpus svenska
Medeltidsbrev: Svenska
Brev på svenska, ur Svenskt Diplomatariums huvudkartotek (SDHK)
Korpus svenska
Medeltidsbrev: Tyska
Brev på tyska, ur Svenskt Diplomatariums huvudkartotek (SDHK)
Korpus tyska
MEPAC bloggar
Korpus svenska
MEPAC intervjuer
Korpus svenska
MuClaGED
MuClaGED är en datamängd för multi-class Grammatical Error Detection för svenska. Den är baserad på SweLL-gold korpusen.
Korpus svenska
MultiGEC
MultiGEC är en datamängd för Grammatical Error Correction (uppgift inom NLP) och innehåller parallel data för 12 språk och 17 delkorpusar. Varje delkorpus består av två eller fler varianter av samma texter (oftast uppsatser som skrivs av språkinlärare), där en version (orig) har skrivits av en författare (elev, student, etc.) och de andra versionerna (ref1, ref2, ...) är korrigerade versioner av samma text. Språk som ingår: tjeckiska, engelska, estniska, tyska, grekiska, isländska, italienska, lettiska, ryska, slovenska, svenska och ukrainska (engelska och ryska kan fås på begäran). Texter kommer från olika ursprungskorpusar, men har genomgått omformattering för att ha en gemensam format.
Korpus tjeckiska, tyska, modern greek (1453-), engelska, estniska, isländska, italienska, lettiska, ryska, slovenska, svenska, ukrainska
MultiGED
MultiGED är en datamängd för Grammatical Error Detection (uppgift inom NLP) och innehåller data för 5 språk (tjeckiska, engelska, tyska, italienska och svenska).
Korpus tjeckiska, tyska, engelska, italienska, svenska
Nils Matsson Kiöpings resor
Reseskildringar från 1674 och 1743
Korpus svenska
NordiCon
NordiCon är en databas som samlar medeltida nordgermanska personnamn från källor utanför Skandinavien.
Lexikon engelska
Norstedtsromaner (1999)
En samling med 23 romaner utgivna 1999 på Norstedts förlag
Korpus svenska
Samling
NPEGL
En databas över nominalfraser i äldre germanska språk.
Lexikon fornengelska (ca 450-1100), fornhögtyska (ca 750-1050), fornisländska, fornsaxiska
NPEGL: Old English
Korpus engelska
NPEGL: Old High German
Korpus
NPEGL: Old Icelandic
Korpus isländska
NPEGL: Old Saxon
Korpus
NPEGL: Old Swedish
Korpus svenska
NyLLex v2
En lexikal resurs baserad på böcker utgivna av det svenska förlaget som publicerar flest lätt-att-läsa texter. Ingångar är annoterade med frekvenser fördelade över sex läsnivåer.
Lexikon svenska
OpenEDGeS
En delmängd av korpusen EDGeS Diachronic Bible Corpus, som tillhandahålls under en publik licens. EDGeS är en diakron och synkron parallelkorpus med bibelöversättningar från 1300-talet till nutid.
Korpus svenska, engelska, tyska, nederländska
ORDAT
Svenska Dagbladets årsbok 1923–1958
Korpus svenska
Ordklasstaggningsmodell: Flair
Förtränade modeller för ordklasstaggning.
Modell svenska
Ordklasstaggningsmodell: Marmot
Förtränade modeller för ordklasstaggning.
Modell svenska
Ordklasstaggningsmodell: Stanza
Förtränade modeller för ordklasstaggning.
Modell svenska
Ordstatistik för korpusar
Ackumulerad ordstatistik från många av våra moderna svenska korpusar
Korpus
OSA (SAOB)
Svenska Akademiens ordbok på nätet
Lexikon svenska
Östgötalagen
Korpus svenska
PAROLE
En korpus annoterad med morfologisk och syntaktisk information
Korpus svenska
Parole
Svenskt PAROLE lexikon - En språkteknologisk resurs med syntaktisk information
Lexikon svenska
Parole+
Svenskt PAROLE lexikon - En språkteknologisk resurs med syntaktisk information, partiellt länkad till betydelser i SALDO
Lexikon svenska
Podiet
Artiklar från Konsertmagasinet Podiet
Korpus svenska
Poeter.se
Poesi från Poeter.se
Korpus svenska
Samling
Press
Svensk press
Korpus svenska
Press 65
Svensk press 1965
Korpus svenska
Press 76
Svensk press 1976
Korpus svenska
Press 95
Svensk press 1995
Korpus svenska
Press 96
Svensk press 1996
Korpus svenska
Press 97
Svensk press 1997
Korpus svenska
Press 98
Svensk press 1998
Korpus svenska
Psalmboken (1937)
Psalmboken från 1937
Korpus svenska
Samling
Riksdagens öppna data
Data från data.riksdagen.se
Korpus svenska
Riksdagens öppna data: Anföranden
Alla riksdagens anföranden från och med riksmötet 1993/94 till och med riksmötet 2017/2018
Korpus svenska
Riksdagens öppna data: Betänkande
Utskottens betänkanden och utlåtanden, inklusive rksdagens beslut, en sammanfattning av voteringsresultaten och Beslut i korthet
Korpus svenska
Riksdagens öppna data: Departementsserien
Utredningar från regeringens departement
Korpus svenska
Riksdagens öppna data: EUN
Dokument från EU-nämnden, bland annat möteskallelser, föredragningslistor, protokoll och skriftliga samråd med regeringen
Korpus svenska
Riksdagens öppna data: Faktapromemoria
Regeringens faktapromemorior om EU-kommissionens förslag
Korpus svenska
Riksdagens öppna data: Föredragningslista
Föredragningslistor för kammarens sammanträden
Korpus svenska
Riksdagens öppna data: Framställning/redogörelse
Framställningar och redogörelser från organ som utsetts av riksdagen
Korpus svenska
Riksdagens öppna data: Interpellation
Interpellationer från ledamöterna till regeringen
Korpus svenska
Riksdagens öppna data: Kammaraktiviteter
Korpus svenska
Riksdagens öppna data: KOM
EU-kommissionens förslag och redogörelser, så kallade KOM-dokument
Korpus svenska
Riksdagens öppna data: Motion
Motioner från riksdagens ledamöter
Korpus svenska
Riksdagens öppna data: Övrigt
Dokumentserierna Riksrevisionens granskningsrapporter, Utredningar från Riksdagsförvaltningen och Rapporter från riksdagen samt planeringsdokument, bilagor till dokument och uttag ur riksdagens databaser och de gamla dokumentserierna Utredningar från riksdag
Korpus svenska
Riksdagens öppna data: Proposition
Propositioner och skrivelser från regeringen
Korpus svenska
Riksdagens öppna data: Protokoll
Protokoll från kammarens sammanträden
Korpus svenska
BibTeX list