Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Datamängder

Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden.
Resurs Antal tokens Språk Åtkomst
Somaliska: Haatuf News 2008
1 286 309 somali
Somaliska: Haatuf News 2009
393 199 somali
Somaliska: Kitaabka Quduuska Ah
841 187 somali
Somaliska: Maaddooyinka Kale 1972–79
14 908 somali
Somaliska: Ogaden Online
98 454 somali
Somaliska: Qoraallo 1956-1970
14 153 somali
Somaliska: Qur’aan
141 555 somali
Somaliska: Raadiyaha Denmark 2014
199 173 somali
Somaliska: Raadiyaha Iswiidhan 2014
235 911 somali
Somaliska: Radio Muqdisho
22 801 somali
Somaliska: Saynis 1972–77
112 845 somali
Somaliska: Saynis 1980–89
33 034 somali
Somaliska: Saynis 1994–96
60 787 somali
Somaliska: Saynis 2001 Somaliland
29 988 somali
Somaliska: Saynis 2001 Soomaaliya
4 659 somali
Somaliska: Saynis 2010 Somaliland
30 471 somali
Somaliska: Saynis 2011 Soomaaliya
45 689 somali
Somaliska: Saynis 2016 Somaliland
31 196 somali
Somaliska: Saynis 2018 Soomaaliya
30 786 somali
Somaliska: Sheekooyin Carruureed
26 003 somali
Somaliska: Sheekooyin Carruureed (Turjuman)
13 865 somali
Somaliska: Sheekooyin Gaagaaban
180 852 somali
Somaliska: Somali Faces
51 440 somali
Somaliska: Suugaan
156 288 somali
Somaliska: Suugaan (Turjuman)
8 796 somali
Somaliska: Suugaan 2
2 827 328 somali
Somaliska: Taariikh iyo Dhaqan (Turjuman)
35 479 somali
Somaliska: Warbixin Ku Saabsan Iswiidhan
59 823 somali
Somaliska: Warbixin Ku Saabsan Kanada
24 039 somali
Somaliska: Wardheer News
499 037 somali
Somaliska: Xeerar Somaliland
450 142 somali
Somaliska: Xisaab 1971-79
1 875 somali
Somaliska: Xisaab 1994-97
713 somali
Somaliska: Xisaab 2001 Somaliland
32 676 somali
Somaliska: Xisaab 2001 Soomaaliya
50 361 somali
Somaliska: Xisaab 2011 Itoobiya
43 977 somali
Somaliska: Xisaab 2016 Somaliland
41 922 somali
Somaliska: Xisaab 2018 Soomaaliya
35 262 somali
SpIn v1
256 essays collected from Language Introduction course (mid-term exams) for newly arrived refugees. Some of the students are recurrent.
46 911 svenska
Språkprov SO 2009
De drygt 94 000 språkexemplen är hämtade ur Svensk ordbok utgiven av Svenska Akademien (2009). Exemplens uppgift är att stödja ordboksdefinitionerna och att ge information om uppslagsordens fraseologi. <br><br>För åtkomst kontakta <a href="mailto:emma.skoldberg@svenska.gu.se">Emma Sköldberg</a>.
541 568 svenska
Samling
Ståndsriksdagen
Samling av textdokument från Ståndsriksdagen
svenska
Ståndsriksdagen: Adelsståndet
Del av Ståndsriksdagen
64 915 391 svenska
Ståndsriksdagen: Bihang m.m.
Del av Ståndsriksdagen
66 201 274 svenska
Ståndsriksdagen: Bondeståndet
Del av Ståndsriksdagen
32 884 985 svenska
Ståndsriksdagen: Borgarståndet
Del av Ståndsriksdagen
35 604 839 svenska
Ståndsriksdagen: Prästeståndet
Del av Ståndsriksdagen
30 653 241 svenska
Ståndsriksdagen: Riksdagsbeslut
Del av Ståndsriksdagen
355 722 svenska
Stockholms stads tänkeböcker
Protokoll och minnesanteckningar från Stockholms rådhusrätt, år 1626.
121 366 svenska
SUC 2.0
Stockholm-Umeå-korpus 2.0
1 166 593 svenska
SUC 3.0
Stockholm-Umeå-korpus 3.0
1 166 593 svenska
SUC-romaner (StorSUC)
Stockholm-Umeå-korpus
4 651 200 svenska
SUCX 2.0
Stockholm-Umeå-korpus 2.0 omkastad
1 166 593 svenska
SUCX 3.0
Stockholm-Umeå-korpus 3.0 omkastad
1 166 593 svenska
Samling
SuperLim 2
A standardized suite for evaluation and analysis of Swedish natural language understanding systems.
svenska
SuperSim (paketerat för Superlim) 2.0
En datamängd för betydelsemässig likhet och koppling mellan svenska ord.
svenska
sv-COVID-19
Blandade artiklar relaterade till coronaviruspandemin
8 130 201 svenska
Svensk ABSAbank
Svensk annoterad korpus för aspektbaserad attitydanalys
1 574 226 svenska
Svensk ABSAbank-Imm 1.1
Svensk annoterad korpus för aspektbaserad attitydanalys (en version av Absabank)
svenska
Svensk analogi 2.0
Svensk semantisk och syntaktisk likhet
svenska
Svensk EAT: frågeklassifikation
En översättning av QAQC datamängden för klassificering av typer av det förväntade svaret
svenska
Svensk författningssamling
Svensk författningssamling 1880-01-01 – 2023-12-15
19 748 312 svenska
Svensk fraktur 1626-1816
Ett urval av svensk fraktur texter tryckta mellan 1626 och 1816 från samlingarna på Universitetsbiblioteket vid Göteborgs universitet (UB). För OCR analys.
47 924 svenska
Svensk prosafiktion 1800–1900
All svensk skönlitteratur som trycktes första gången åren 1800, 1820, 1840, 1860, 1880 och 1900
16 275 130 svenska
Svensk Tidskrift
27 årgångar av den konservativa idétidskriften Svensk Tidskrift, mellan 1891 och 1940
7 202 567 svenska
Svensk trädbank
En svensk trädbank med återanvändning av existerande resurser
svenska
Svensk Twitter 2015
Material från ett urval av svenskspråkiga Twitteranvändare från 2015
412 663 140 svenska
Svensk Twitter 2016
Material från ett urval av svenskspråkiga Twitteranvändare från 2016
694 515 420 svenska
Svensk Twitter 2017
Material från ett urval av svenskspråkiga Twitteranvändare från 2017
505 017 012 svenska
Svenska partiprogram och valmanifest
De svenska partiernas partiprogram och valmanifest 1887–2024
2 234 400 svenska
Svenska tidningar 1818-1870
Ett urval av svenska tidningar tryckta mellan 1818 och 1870 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
186 013 svenska
Svenska tidningar 1871-1906
Ett urval av svenska tidningar tryckta mellan 1871 och 1906 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
337 635 svenska
Svenska Wikipedia
Korpus av svenskspråkiga Wikipedia
190 149 497 svenska
Svenskt frasnät (SweFN)
En lexikalisk-semantisk resurs baserad på samma principer som engelska Berkeley FrameNet. Denna del av resursen innehåller korpusexemplen, automatiskt annoterade med språklig information.
137 770 svenska
SveParafras 2.0
Referensdatan för semantisk textjämförelse (STS Benchmark)
svenska
Samling
SVT nyheter
Nyhetstexter från svt.se
svenska
SVT nyheter 2004
Nyhetstexter från svt.se
447 189 svenska
SVT nyheter 2005
Nyhetstexter från svt.se
3 300 646 svenska
SVT nyheter 2006
Nyhetstexter från svt.se
4 172 111 svenska
SVT nyheter 2007
Nyhetstexter från svt.se
5 533 682 svenska
SVT nyheter 2008
Nyhetstexter från svt.se
7 693 570 svenska
SVT nyheter 2009
Nyhetstexter från svt.se
8 860 985 svenska
SVT nyheter 2010
Nyhetstexter från svt.se
9 873 332 svenska
SVT nyheter 2011
Nyhetstexter från svt.se
9 327 078 svenska
SVT nyheter 2012
Nyhetstexter från svt.se
9 544 671 svenska
SVT nyheter 2013
Nyhetstexter från svt.se
13 961 829 svenska
SVT nyheter 2014
Nyhetstexter från svt.se
16 077 222 svenska
SVT nyheter 2015
Nyhetstexter från svt.se
19 205 040 svenska
SVT nyheter 2016
Nyhetstexter från svt.se
21 729 542 svenska
SVT nyheter 2017
Nyhetstexter från svt.se
21 184 642 svenska
SVT nyheter 2018
Nyhetstexter från svt.se
18 817 638 svenska
SVT nyheter 2019
Nyhetstexter från svt.se
18 274 785 svenska
SVT nyheter 2020
Nyhetstexter från svt.se
16 025 766 svenska
SVT nyheter 2021
Nyhetstexter från svt.se
14 978 995 svenska
SVT nyheter 2022
Nyhetstexter från svt.se
13 996 419 svenska
SVT nyheter 2023
Nyhetstexter från svt.se
7 501 502 svenska
SVT nyheter okänt datum
Nyhetstexter från svt.se
36 783 svenska
SW1203-uppsatser
Essays written by L2 Swedish language learners, university courses
51 972 svenska
Swe-NERC
En resurs för träning och utvärdering av igenkänning av namngiven entitet för svenska.
140 914 svenska
SweDiagnostics
Svenska versionen av (Super)GLUE diagnostik
svenska
SweDN 1.0
A Swedish text summarization corpus
svenska
BibTeX list