Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Datamängder

Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden.
Resurs Typ Språk Åtkomst
Samling
Äldre finlandssvenska
Del av finlandssvensk språkbank över svenskan i Finland i dag och i går
Korpus svenska
Samling
ASPAC
The Amsterdam Slavic Parallel Aligned Corpus
Korpus svenska, vitryska, bulgariska, tjeckiska, tyska, lågsorbiska, modern greek (1453-), engelska, spanska, franska, kroatiska, högsorbiska, latin, makedonska, nederländska, polska, portugisiska, rumänska, ryska, kele (papua new guinea), slovakiska, slovenska, serbiska, moliseslaviska, turkmeniska, ukrainska
Samling
Bloggmix
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus svenska
Samling
Europarl
European Parliament Proceedings Parallel Corpus
Korpus svenska, danska, tyska, modern greek (1453-), engelska, spanska, finska, franska, italienska, nederländska, portugisiska
Samling
Familjeliv
Material från diskussionsforumet Familjeliv
Korpus svenska
Samling
Finlandssvenska
Del av finlandssvensk språkbank över svenskan i Finland i dag och i går
Korpus svenska
Samling
Flashback
Material från diskussionsforumet Flashback
Korpus svenska
Samling
Fornsvenska textbankens material
En samling fornsvenska texter från Fornsvenska textbanken
Korpus svenska
Samling
Göteborgsposten
En korpus med texter från Göteborgs-Posten
Korpus svenska
Samling
Kubhist
Diakronisk samling av historisk tidsskriftstext på svenska från perioden 1749–1926
Korpus svenska
Samling
Kubhist 2
Diakronisk samling av historisk tidsskriftstext på svenska från perioden 1645–1926. Kubhist 2 är en uppdaterad version av Kubhist med förbättrad OCR och mer material.
Korpus svenska
Samling
Kubord 1
Ordfrekvenser från moderna tidningstexter från Kungliga biblioteket
Korpus svenska
Samling
Kubord 2
Ordrelationer från moderna tidningstexter från Kungliga biblioteket
Korpus svenska
Samling
Kubord-fasttext
En samling fasttext-modeller tränade på moderna tidningstexter från Kungliga biblioteket
Modell svenska
Samling
Kvinnotidningar
Material från äldre svenska kvinnotidskrifter
Korpus svenska
Samling
Läkartidningen
Korpus för vårdens och omsorgens fackspråk
Korpus svenska
Samling
Learner Language
Learner Language är en samling av korpusar och lexikala resurser som beskriver inlärarspråket. Korpusar inkluderar både texter/audio som produceras av de som lär sig språket, och texter/språket som de utsätts för (läser eller hör, t.ex. kursböcker). Även en del derivata resurser utifrån dessa korpusar är med i denna samling.
Korpus svenska, flera språk
Samling
Medeltidsbrev
Svenskt Diplomatariums huvudkartotek över medeltidsbreven (SDHK)
Korpus latin, tyska, norska, svenska
Samling
NPEGL
En databas över nominalfraser i äldre germanska språk.
Lexikon fornengelska (ca 450-1100), fornhögtyska (ca 750-1050), fornisländska, fornsaxiska
Samling
Press
Svensk press
Korpus svenska
Samling
Riksdagens öppna data
Data från data.riksdagen.se
Korpus svenska
Samling
Somaliska korpusar
En samling av korpusar på somaliska
Korpus somali
Samling
Ståndsriksdagen
Samling av textdokument från Ståndsriksdagen
Korpus svenska
Samling
SuperLim 2
A standardized suite for evaluation and analysis of Swedish natural language understanding systems.
Korpus svenska
Samling
SVT nyheter
Nyhetstexter från svt.se
Korpus svenska
Samling
SweLL
SweLL -- Swedish Learner Language -- är en samling av SweLL korpusar och derivata resurser med ursprung i dessa korpusar. SweLL korpusar består av elevtexter som skrevs av elever med andra modersmål än svenska (andraspråkskorpusar). Alla texter samlades inom provsituationer (ej hemuppgifter).
Korpus svenska, flera språk
Samling
SweLL-pilot
Uppsatser skrivna av vuxenstuderande i svenska, annoterade med CEFR nivåerna (en Europeisk skala med färdighetsnivåer inom språkinlärningen). Uppsatserna samlades under perioden 2006-2015.
Korpus svenska
Samling
Tvåkammarriksdagen
Samling av textdokument från Tvåkammarriksdagen
Korpus svenska
Samling
Webbnyheter
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
BibTeX list