Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Datamängder

Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden.
Resurs Typ Språk Åtkomst
Samling
Äldre finlandssvenska
Del av finlandssvensk språkbank över svenskan i Finland i dag och i går
Korpus svenska
Samling
ASPAC
The Amsterdam Slavic Parallel Aligned Corpus
Korpus svenska, vitryska, bulgariska, tjeckiska, tyska, lågsorbiska, modern greek (1453-), engelska, spanska, franska, kroatiska, högsorbiska, latin, makedonska, nederländska, polska, portugisiska, rumänska, ryska, kele (papua new guinea), slovakiska, slovenska, serbiska, slavomolisano, turkmeniska, ukrainska
Samling
Bloggmix
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus svenska
Samling
Europarl
European Parliament Proceedings Parallel Corpus
Korpus svenska, danska, tyska, modern greek (1453-), engelska, spanska, finska, franska, italienska, nederländska, portugisiska
Samling
Familjeliv
Material från diskussionsforumet Familjeliv
Korpus svenska
Samling
Finlandssvenska
Del av finlandssvensk språkbank över svenskan i Finland i dag och i går
Korpus svenska
Samling
Flashback
Material från diskussionsforumet Flashback
Korpus svenska
Samling
Fornsvenska textbankens material
En samling fornsvenska texter från Fornsvenska textbanken
Korpus svenska
Samling
Göteborgsposten
En korpus med texter från Göteborgs-Posten
Korpus svenska
Samling
Kubhist
Diakronisk samling av historisk tidsskriftstext på svenska från perioden 1749–1926
Korpus svenska
Samling
Kubhist 2
Diakronisk samling av historisk tidsskriftstext på svenska från perioden 1645–1926. Kubhist 2 är en uppdaterad version av Kubhist med förbättrad OCR och mer material.
Korpus svenska
Samling
Kubord 1
Ordfrekvenser från moderna tidningstexter från Kungliga biblioteket
Korpus svenska
Samling
Kubord 2
Ordrelationer från moderna tidningstexter från Kungliga biblioteket
Korpus svenska
Samling
Kubord-fasttext
En samling fasttext-modeller tränade på moderna tidningstexter från Kungliga biblioteket
Modell svenska
Samling
Kvinnotidningar
Material från äldre svenska kvinnotidskrifter
Korpus svenska
Samling
Läkartidningen
Korpus för vårdens och omsorgens fackspråk
Korpus svenska
Samling
Medeltidsbrev
Svenskt Diplomatariums huvudkartotek över medeltidsbreven (SDHK)
Korpus latin, tyska, norska, svenska
Samling
NPEGL
En databas över nominalfraser i äldre germanska språk.
Lexikon fornengelska (ca 450-1100), fornhögtyska (ca 750-1050), fornisländska, fornsaxiska
Samling
Press
Svensk press
Korpus svenska
Samling
Riksdagens öppna data
Data från data.riksdagen.se
Korpus svenska
Samling
Somaliska korpusar
En samling av korpusar på somaliska
Korpus somali
Samling
Ståndsriksdagen
Samling av textdokument från Ståndsriksdagen
Korpus svenska
Samling
SuperLim 2
A standardized suite for evaluation and analysis of Swedish natural language understanding systems.
Korpus svenska
Samling
SVT nyheter
Nyhetstexter från svt.se
Korpus svenska
Samling
SweLL-pilot
Uppsatser svrivna av vuxenstuderande i svenska, manuellt anonymiserade och annoterade med felkategorier. Korpusen innehåller både originaltexten och en normaliserad version av varje uppsats. Insamlingperiod 2006-2015.
Korpus svenska
Samling
Tvåkammarriksdagen
Samling av textdokument från Tvåkammarriksdagen
Korpus svenska
Samling
Webbnyheter
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
BibTeX list (experimental feature)