Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Datamängder

Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden.
Resurs Typ Språk Åtkomst
Ståndsriksdagen: Borgarståndet
Del av Ståndsriksdagen
Korpus svenska
Ståndsriksdagen: Prästeståndet
Del av Ståndsriksdagen
Korpus svenska
Ståndsriksdagen: Riksdagsbeslut
Del av Ståndsriksdagen
Korpus svenska
Stockholms stads tänkeböcker
Protokoll och minnesanteckningar från Stockholms rådhusrätt, år 1626.
Korpus svenska
SUC 2.0
Stockholm-Umeå-korpus 2.0
Korpus svenska
SUC 3.0
Stockholm-Umeå-korpus 3.0
Korpus svenska
SUC-romaner (StorSUC)
Stockholm-Umeå-korpus
Korpus svenska
SUCX 2.0
Stockholm-Umeå-korpus 2.0 omkastad
Korpus svenska
SUCX 3.0
Stockholm-Umeå-korpus 3.0 omkastad
Korpus svenska
Samling
SuperLim 2
A standardized suite for evaluation and analysis of Swedish natural language understanding systems.
Korpus svenska
SuperSim (paketerat för Superlim) 2.0
En datamängd för betydelsemässig likhet och koppling mellan svenska ord.
Korpus svenska
sv-COVID-19
Blandade artiklar relaterade till coronaviruspandemin
Korpus svenska
Svensk ABSAbank
Svensk annoterad korpus för aspektbaserad attitydanalys
Korpus svenska
Svensk ABSAbank-Imm 1.1
Svensk annoterad korpus för aspektbaserad attitydanalys (en version av Absabank)
Korpus svenska
Svensk analogi 2.0
Svensk semantisk och syntaktisk likhet
Korpus svenska
Svensk EAT: frågeklassifikation
En översättning av QAQC datamängden för klassificering av typer av det förväntade svaret
Korpus svenska
Svensk författningssamling
Svensk författningssamling 1880-01-01 – 2023-12-15
Korpus svenska
Svensk fraktur 1626-1816
Ett urval av svensk fraktur texter tryckta mellan 1626 och 1816 från samlingarna på Universitetsbiblioteket vid Göteborgs universitet (UB). För OCR analys.
Korpus svenska
Svensk prosafiktion 1800–1900
All svensk skönlitteratur som trycktes första gången åren 1800, 1820, 1840, 1860, 1880 och 1900
Korpus svenska
Svensk Tidskrift
27 årgångar av den konservativa idétidskriften Svensk Tidskrift, mellan 1891 och 1940
Korpus svenska
Svensk trädbank
En svensk trädbank med återanvändning av existerande resurser
Korpus svenska
Svensk Twitter 2015
Material från ett urval av svenskspråkiga Twitteranvändare från 2015
Korpus svenska
Svensk Twitter 2016
Material från ett urval av svenskspråkiga Twitteranvändare från 2016
Korpus svenska
Svensk Twitter 2017
Material från ett urval av svenskspråkiga Twitteranvändare från 2017
Korpus svenska
Svensk-finska ordlistor
Svensk-finska ordlistor inom olika ämnesområden
Lexikon svenska
Svenska historiska inbäddningar (word embeddings)
Förtränade inbäddningar (word embeddings) för historisk svenska
Modell svenska
Svenska ord, LEXIN
Lexikon för invandrare. Andra upplagan
Lexikon svenska, albanska, bosniska, engelska, finska, modern greek (1453-), kroatiska, kurdiska, iranian persian, ryska, serbiska, somali, spanska, turkiska
Svenska partiprogram och valmanifest
De svenska partiernas partiprogram och valmanifest 1887–2024
Korpus svenska
Svenska tidningar 1818-1870
Ett urval av svenska tidningar tryckta mellan 1818 och 1870 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
Korpus svenska
Svenska tidningar 1871-1906
Ett urval av svenska tidningar tryckta mellan 1871 och 1906 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
Korpus svenska
Svenska Wikipedia
Korpus av svenskspråkiga Wikipedia
Korpus svenska
Svenskt frasnät (SweFN)
En lexikal-semantisk resurs baserad på samma principer som engelska Berkeley FrameNet. Denna del av resursen innehåller de semantiska ramarna och det manuellt annoterade semantiska innehållet.
Lexikon svenska
Svenskt frasnät (SweFN)
En lexikalisk-semantisk resurs baserad på samma principer som engelska Berkeley FrameNet. Denna del av resursen innehåller korpusexemplen, automatiskt annoterade med språklig information.
Korpus svenska
Svenskt frasnät 2.0 (SweFN)
En lexikal-semantisk resurs baserad på samma principer som engelska Berkeley FrameNet. Denna version är uppdaterad för att motsvara BFN 1.7.
Lexikon svenska
SveParafras 2.0
Referensdatan för semantisk textjämförelse (STS Benchmark)
Korpus svenska
Samling
SVT nyheter
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2004
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2005
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2006
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2007
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2008
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2009
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2010
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2011
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2012
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2013
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2014
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2015
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2016
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2017
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2018
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2019
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2020
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2021
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2022
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2023
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter okänt datum
Nyhetstexter från svt.se
Korpus svenska
SW1203-uppsatser
Essays written by L2 Swedish language learners, university courses
Korpus svenska
Swe-NERC
En resurs för träning och utvärdering av igenkänning av namngiven entitet för svenska.
Korpus svenska
Swedbergs Swensk ordabok
Swedbergs Swensk Ordabok
Lexikon svenska, latin
Swedbergs Swensk ordabok (morfologi, f.n. rudimentär)
Swedbergs Swensk Ordabok (morfologi, f.n. rudimentär)
Lexikon svenska
SweDiagnostics
Svenska versionen av (Super)GLUE diagnostik
Korpus svenska
SweDN 1.0
A Swedish text summarization corpus
Korpus svenska
SweFAQ 2.0
Vanliga frågor från svenska myndigheters webbsidor med svar i randomiserad ordning
Korpus svenska
SweFraCas 1.0
Textual inference/entailment problem set
Korpus svenska
SweLL-gold
Uppsatser skrivna av vuxenstuderande i svenska, manuellt pseudonymiserade och annoterade med felkategorier. Korpusen innehåller både originaltexten och en normaliserad version av varje uppsats. Insamlingperiod 2017-2020.
Korpus svenska
Samling
SweLL-pilot
Uppsatser svrivna av vuxenstuderande i svenska, manuellt anonymiserade och annoterade med felkategorier. Korpusen innehåller både originaltexten och en normaliserad version av varje uppsats. Insamlingperiod 2006-2015.
Korpus svenska
SweNLI 1.0
A Swedish NLI dataset
Korpus svenska
SweSAT Högskoleprovet ordförståelse 1.1
Högskoleprovet ordförståelse
Lexikon svenska
Swesaurus
Ett svenskt ordnät
Lexikon svenska
SweWiC 2.0
En svensk ord-i-sammanhang datamängd
Korpus svenska
SweWinogender 2.0
En svensk datamängd för koreferens och könsbias
Korpus svenska
SweWinograd 2.0
En svensk datamängd för pronomentolkning
Korpus svenska
Syntag trädbank
En svensk trädbank med syntaktisk analys av 158 artiklar ur Press-65.
Korpus svenska
Sæmundaredda
Forntida isländsk poesi även känd som The King's Book
Korpus fornisländska
TalbankenSBX
Talbanken är en svensk trädbank. Detta är Språkbanken Texts version av Talbanken.
Korpus svenska
TalbankenSTB
Talbanken är en svensk trädbank.
Korpus svenska
The English-Swedish Parallel Corpus (ESPC)
ESPC är en kombinerad jämförbar och parallell korpus lämplig för tvärspråkig forskning för olika typer.
Korpus svenska, engelska
The Swedish Culturomics Gigaword Corpus
En miljard ord ur svenska korpusar från 1950 och framåt. Kod för att extrahera data från korpusen, samt användningsinstruktioner, kan laddas ner från https://svn.spraakbanken.gu.se/sb-arkiv/tools/gigaword/
Korpus svenska
The Swedish PoliGraph
En utvidgbar kunskapsgraf med information om Riksdagens ledamöter
Lexikon svenska
Tiden
30 årgångar av den socialistiska tidskriften Tiden, 1909–1940
Korpus svenska
TISUS-texter
Essays written by L2 Swedish learners as part of a TISUS exam
Korpus svenska
Samling
Tvåkammarriksdagen
Samling av textdokument från Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Berättelser, redogörelser, framställningar
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Betänkanden, memorial, utlåtanden
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Motioner
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Propositioner, skrivelser
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Protokoll
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Register
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Reglementen, svensk författningssamling
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Riksdagens författningssamling RFS
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Riksdagsakter
Del av Ståndsriksdagen
Korpus svenska
Tvåkammarriksdagen: Riksdagsskrivelser
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Utredningar, EU-förslag, betänkande, statens offentliga utredningar
Del av Tvåkammarriksdagen
Korpus svenska
Twitter: Partiledardebatt juni 2013
Material från Twitter, insamlat under partiledardebatten 12 juni 2013 samt några dagar före och efter
Korpus svenska
Twitter: Partiledardebatt maj 2014
Material från Twitter, insamlat under partiledardebatten 4 maj 2014 samt några dagar före och efter
Korpus svenska
Twitter: Partiledardebatt oktober 2013
Material från Twitter, insamlat under partiledardebatten 6 oktober 2013 samt några dagar före och efter
Korpus svenska
Twittermix
Material från ett urval av svenska Twitteranvändare. Uppdateras regelbundet.
Korpus svenska
UNSC-Graph
En utvidgbar kunskapsgraf för UNSC-korpusen med detaljer om deltagare och debatter från FN:s säkerhetsråd 1995-2020
Lexikon engelska
Ur Dagens Krönika
Åtta årgångar av kulturtidskriften Ur Dagens Krönika, 1881–1890
Korpus svenska
BibTeX list (experimental feature)