Hoppa till huvudinnehåll
Svenska
English
Språkbanken Text är en avdelning inom
Språkbanken
.
Aktuellt
Forskning
Verktyg
Data
Frågelåda
Om oss
Kontakt
Meny
Länkstig
Hem
Datamängder
Datamängder
Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden.
Alla (1323)
Samlingar (30)
Korpusar (1198)
Lexikon (62)
Tränings- och utvärderingsdata (15)
Modeller (48)
Namn eller beskrivning
Språk
- Alla -
svenska
albanska
blissymboler
bokmål
bosniska
bulgariska
danska
engelska
estniska
finlandssvenska
finska
flera språk
fornengelska (ca 450-1100)
fornhögtyska (ca 750-1050)
fornisländska
fornsaxiska
franska
färöiska
högsorbiska
iranian persian
isländska
italienska
kele (papua new guinea)
kroatiska
kurdiska
latin
lettiska
lågsorbiska
makedonska
modern greek (1453-)
moliseslaviska
nederländska
norska
polska
portugisiska
rumänska
ryska
serbiska
slovakiska
slovenska
somali
spanska
tjeckiska
turkiska
turkmeniska
tyska
ukrainska
vitryska
xhosa
Resurs
Typ
Språk
Åtkomst
Somaliska: Sheekooyin Carruureed (Turjuman)
Korpus
somali
Datamängd:
somali-sheekooyin-carruureed.xml.bz2
2021-08-30 – 43.72 KB – CC BY 4.0
Utforska i:
Somaliska: Sheekooyin Gaagaaban
Korpus
somali
Datamängd:
somali-sheekooying.xml.bz2
2021-08-27 – 628.9 KB – CC BY 4.0
Utforska i:
Somaliska: Somali Faces
Korpus
somali
Datamängd:
somali-faces.xml.bz2
2017-01-30 – 119.98 KB – CC BY 4.0
Utforska i:
Somaliska: Suugaan
Korpus
somali
Datamängd:
somali-suugaan.xml.bz2
2017-11-27 – 364.94 KB – CC BY 4.0
Ordstatistik:
stats_SOMALI-SUUGAAN.txt
2020-02-25 – 502.45 KB – CC BY 4.0
Utforska i:
Somaliska: Suugaan (Turjuman)
Korpus
somali
Datamängd:
somali-suugaan-turjuman.xml.bz2
2021-08-27 – 27.26 KB – CC BY 4.0
Utforska i:
Somaliska: Suugaan 2
Korpus
somali
Datamängd:
somali-suugaan2.xml.bz2
2022-12-15 – 7.13 MB – CC BY 4.0
Utforska i:
Somaliska: Taariikh iyo Dhaqan (Turjuman)
Korpus
somali
Datamängd:
somali-tid-turjuman.xml.bz2
2021-08-30 – 108.74 KB – CC BY 4.0
Utforska i:
Somaliska: Warbixin Ku Saabsan Iswiidhan
Korpus
somali
Datamängd:
somali-wksi.xml.bz2
2017-01-30 – 124.78 KB – CC BY 4.0
Utforska i:
Somaliska: Warbixin Ku Saabsan Kanada
Korpus
somali
Datamängd:
somali-wksk.xml.bz2
2017-01-30 – 48.91 KB – CC BY 4.0
Utforska i:
Somaliska: Wardheer News
Korpus
somali
Datamängd:
somali-wardheer.xml.bz2
2017-05-31 – 1.37 MB – CC BY 4.0
Utforska i:
Somaliska: Xeerar Somaliland
Korpus
somali
Datamängd:
somali-xeerar.xml.bz2
2017-05-31 – 1.04 MB – CC BY 4.0
Utforska i:
Somaliska: Xisaab 1971-79
Korpus
somali
Datamängd:
somali-xisaab-1971-79.xml.bz2
2017-01-30 – 6.55 KB – CC BY 4.0
Utforska i:
Somaliska: Xisaab 1994-97
Korpus
somali
Datamängd:
somali-xisaab-1994-97.xml.bz2
2017-01-30 – 2.64 KB – CC BY 4.0
Utforska i:
Somaliska: Xisaab 2001 Somaliland
Korpus
somali
Datamängd:
somali-xisaab-2001-hargeysa.xml.bz2
2019-10-01 – 69.66 KB – CC BY 4.0
Utforska i:
Somaliska: Xisaab 2001 Soomaaliya
Korpus
somali
Datamängd:
somali-xisaab-2001-nayroobi.xml.bz2
2021-08-27 – 138.5 KB – CC BY 4.0
Utforska i:
Somaliska: Xisaab 2011 Itoobiya
Korpus
somali
Datamängd:
somali-xisaab-2011-itoobiya.xml.bz2
2017-09-20 – 83.62 KB – CC BY 4.0
Utforska i:
Somaliska: Xisaab 2016 Somaliland
Korpus
somali
Datamängd:
somali-xisaab-2016-somaliland.xml.bz2
2021-08-27 – 117.01 KB – CC BY 4.0
Utforska i:
Somaliska: Xisaab 2018 Soomaaliya
Korpus
somali
Datamängd:
somali-xisaab-2018-soomaaliya.xml.bz2
2019-10-01 – 55.16 KB – CC BY 4.0
Utforska i:
SpIn
Korpus
svenska
Ordstatistik:
stats_SPIN-SOURCE.txt
2020-02-25 – 292.82 KB – CC BY 4.0
Utforska i:
SpIn v1
256 essays collected from Language Introduction course (mid-term exams) for newly arrived refugees. Some of the students are recurrent.
Korpus
svenska
Utforska i:
Sportanglicismer
Engelska lånord i svenska sportspalter
Lexikon
svenska
Utforska i:
Språkprov SO 2009
De drygt 94 000 språkexemplen är hämtade ur Svensk ordbok utgiven av Svenska Akademien (2009). Exemplens uppgift är att stödja ordboksdefinitionerna och att ge information om uppslagsordens fraseologi. <br><br>För åtkomst kontakta <a href="mailto:emma.skoldberg@svenska.gu.se">Emma Sköldberg</a>.
Korpus
svenska
Utforska i:
Samling
Ståndsriksdagen
Samling av textdokument från Ståndsriksdagen
Korpus
svenska
Se 7 delresurser
Utforska i:
Ståndsriksdagen: Adelsståndet
Del av Ståndsriksdagen
Korpus
svenska
Datamängd:
standsriksdagen-adelsstandet.xml.bz2
2024-06-17 – 852.82 MB – CC BY 4.0
Ordstatistik:
stats_standsriksdagen-adelsstandet.csv
2024-08-05 – 75.66 MB – CC BY 4.0
Utforska i:
Ståndsriksdagen: Bihang m.m.
Del av Ståndsriksdagen
Korpus
svenska
Datamängd:
standsriksdagen-bihang.xml.bz2
2024-06-18 – 841.09 MB – CC BY 4.0
Ordstatistik:
stats_standsriksdagen-bihang.csv
2024-08-05 – 88.43 MB – CC BY 4.0
Utforska i:
Ståndsriksdagen: Bondeståndet
Del av Ståndsriksdagen
Korpus
svenska
Datamängd:
standsriksdagen-bondestandet.xml.bz2
2024-06-18 – 411.81 MB – CC BY 4.0
Ordstatistik:
stats_standsriksdagen-bondestandet.csv
2024-08-05 – 54.4 MB – CC BY 4.0
Utforska i:
Ståndsriksdagen: Borgarståndet
Del av Ståndsriksdagen
Korpus
svenska
Datamängd:
standsriksdagen-borgarstandet.xml.bz2
2024-06-18 – 477.72 MB – CC BY 4.0
Ordstatistik:
stats_standsriksdagen-borgarstandet.csv
2024-08-05 – 50.25 MB – CC BY 4.0
Utforska i:
Ståndsriksdagen: Prästeståndet
Del av Ståndsriksdagen
Korpus
svenska
Datamängd:
standsriksdagen-prastestandet.xml.bz2
2024-06-19 – 422.82 MB – CC BY 4.0
Ordstatistik:
stats_standsriksdagen-prastestandet.csv
2024-08-05 – 45.59 MB – CC BY 4.0
Utforska i:
Ståndsriksdagen: Riksdagsbeslut
Del av Ståndsriksdagen
Korpus
svenska
Datamängd:
standsriksdagen-riksdagsbeslut.xml.bz2
2024-06-18 – 3.44 MB – CC BY 4.0
Ordstatistik:
stats_standsriksdagen-riksdagsbeslut.csv
2024-08-05 – 2.96 MB – CC BY 4.0
Utforska i:
Stockholms stads tänkeböcker
Protokoll och minnesanteckningar från Stockholms rådhusrätt, år 1626.
Korpus
svenska
Datamängd:
tankebok.xml.bz2
2014-12-08 – 661.68 KB – CC BY 4.0
Ordstatistik:
stats_TANKEBOK.txt
2015-06-25 – 595.1 KB – CC BY 4.0
Utforska i:
SUC 2.0
Stockholm-Umeå-korpus 2.0
Korpus
svenska
Ordstatistik:
stats_SUC2.txt
2017-05-21 – 6.65 MB – CC BY 4.0
SUC 3.0
Stockholm-Umeå-korpus 3.0
Korpus
svenska
Datamängd:
suc3.xml.bz2
2024-06-03 – 84.44 MB – CC BY 4.0
Ordstatistik:
stats_suc3.csv
2024-03-28 – 7.7 MB – CC BY 4.0
Utforska i:
SUC-romaner (StorSUC)
Stockholm-Umeå-korpus
Korpus
svenska
Datamängd:
storsuc.xml.bz2
2017-04-26 – 68.28 MB – CC BY 4.0
Ordstatistik:
stats_STORSUC.txt
2017-04-30 – 11.23 MB – CC BY 4.0
Utforska i:
SUCX 2.0
Stockholm-Umeå-korpus 2.0 omkastad
Korpus
svenska
Datamängd:
suc2.xml.bz2
2017-05-19 – 17.68 MB – CC BY-SA 4.0
Ordstatistik:
stats_SUC2.txt
2017-05-21 – 6.65 MB – CC BY-SA 4.0
Utforska i:
SUCX 3.0
Stockholm-Umeå-korpus 3.0 omkastad
Korpus
svenska
Datamängd:
suc3.xml.bz2
2024-06-03 – 84.44 MB – CC BY-SA 4.0
Ordstatistik:
stats_suc3.csv
2024-03-28 – 7.7 MB – CC BY 4.0
Utforska i:
Samling
SuperLim 2
A standardized suite for evaluation and analysis of Swedish natural language understanding systems.
Korpus
svenska
Datamängd:
SuperLim-2-2.0.4.zip
2024-01-25 – 156.63 MB – CC BY 4.0
Datamängd:
SuperLim_maintenance.odt
2024-01-25 – 16.96 KB
SuperSim (paketerat för Superlim) 2.0
En datamängd för betydelsemässig likhet och koppling mellan svenska ord.
Korpus
svenska
Datamängd:
supersim-superlim.zip
2023-03-30 – 70.45 KB – CC BY 4.0
sv-COVID-19
Blandade artiklar relaterade till coronaviruspandemin
Korpus
svenska
Datamängd:
sv-covid-19.xml.bz2
2023-05-29 – 200.6 MB – CC BY 4.0
Ordstatistik:
stats_sv-covid-19.csv
2023-05-29 – 12.47 MB – CC BY 4.0
Utforska i:
SVALex
SVALex är en ordlista med receptivt ordförråd för elever med svenska som andraspråk
Lexikon
svenska
Datamängd:
svalex_xlsx.tar.bz2
2025-01-24 – 2.16 MB – CC BY-NC-SA 4.0
Datamängd:
svalex_tsv.tar.bz2
2025-01-24 – 203.25 KB – CC BY-NC-SA 4.0
Utforska i:
Svensk ABSAbank
Svensk annoterad korpus för aspektbaserad attitydanalys
Korpus
svenska
Datamängd:
swe-absa-bank.zip
2020-03-04 – 128.55 MB – CC BY 4.0
Datamängd:
absabankimm-combined.zip
2023-02-20 – 15.87 MB – CC BY 4.0
Svensk ABSAbank-Imm 1.1
Svensk annoterad korpus för aspektbaserad attitydanalys (en version av Absabank)
Korpus
svenska
Datamängd:
absabank-imm.zip
2023-03-30 – 1.03 MB – CC BY 4.0
Svensk analogi 2.0
Svensk semantisk och syntaktisk likhet
Korpus
svenska
Datamängd:
sweanalogy.zip
2023-03-30 – 178.63 KB – CC BY 4.0
Svensk EAT: frågeklassifikation
En översättning av QAQC datamängden för klassificering av typer av det förväntade svaret
Korpus
svenska
Datamängd:
swe_qaqc_train.csv
2023-06-08 – 361.34 KB – CC BY 4.0
Datamängd:
Swedish_EAT_v1.0.tsv
2023-06-08 – 2.05 KB – CC BY 4.0
Svensk författningssamling
Svensk författningssamling 1880-01-01 – 2023-12-15
Korpus
svenska
Datamängd:
sfs.xml.bz2
2024-05-13 – 325.85 MB – CC BY 4.0
Ordstatistik:
stats_sfs.csv
2024-05-20 – 16.16 MB – CC BY 4.0
Utforska i:
Svensk fraktur 1626-1816
Ett urval av svensk fraktur texter tryckta mellan 1626 och 1816 från samlingarna på Universitetsbiblioteket vid Göteborgs universitet (UB). För OCR analys.
Korpus
svenska
Datamängd:
svensk-fraktur-1626-1816.tar.gz
2021-11-26 – 757.73 MB – CC BY 4.0
Svensk prosafiktion 1800–1900
All svensk skönlitteratur som trycktes första gången åren 1800, 1820, 1840, 1860, 1880 och 1900
Korpus
svenska
Datamängd:
spf.xml.bz2
2017-05-19 – 231.69 MB – CC BY 4.0
Ordstatistik:
stats_SPF.txt
2021-05-09 – 18.23 MB – CC BY 4.0
Utforska i:
Svensk Tidskrift
27 årgångar av den konservativa idétidskriften Svensk Tidskrift, mellan 1891 och 1940
Korpus
svenska
Datamängd:
runeberg-svtidskr.xml.bz2
2014-12-08 – 93.06 MB – CC BY 4.0
Ordstatistik:
stats_RUNEBERG-SVTIDSKR.txt
2015-06-25 – 22.18 MB – CC BY 4.0
Utforska i:
Svensk trädbank
En svensk trädbank med återanvändning av existerande resurser
Korpus
svenska
Svensk Twitter 2015
Material från ett urval av svenskspråkiga Twitteranvändare från 2015
Korpus
svenska
Ordstatistik:
stats_TWITTER-2015.txt
2018-02-04 – 615.63 MB – CC BY 4.0
Utforska i:
Svensk Twitter 2016
Material från ett urval av svenskspråkiga Twitteranvändare från 2016
Korpus
svenska
Ordstatistik:
stats_TWITTER-2016.txt
2018-02-11 – 805.79 MB – CC BY 4.0
Utforska i:
Svensk Twitter 2017
Material från ett urval av svenskspråkiga Twitteranvändare från 2017
Korpus
svenska
Ordstatistik:
stats_TWITTER-2017.txt
2018-02-18 – 652.14 MB – CC BY 4.0
Utforska i:
Svensk-finska ordlistor
Svensk-finska ordlistor inom olika ämnesområden
Lexikon
svenska
Svenska historiska inbäddningar (word embeddings)
Förtränade inbäddningar (word embeddings) för historisk svenska
Modell
svenska
Datamängd:
HENGCHEN-TAHMASEBI_-_2020_-_Kubhist2_diachronic_embeddings.zip
2024-01-25 – 15.13 GB – CC BY 4.0
Svenska ord, LEXIN
Lexikon för invandrare. Andra upplagan
Lexikon
svenska, albanska, bosniska, engelska, finska, modern greek (1453-), kroatiska, kurdiska, iranian persian, ryska, serbiska, somali, spanska, turkiska
Datamängd:
LEXIN.zip
2024-01-25 – 1.05 MB – CC BY 4.0
Utforska i:
Svenska partiprogram och valmanifest
De svenska partiernas partiprogram och valmanifest 1887–2024
Korpus
svenska
Datamängd:
vivill.xml.bz2
2024-06-10 – 165.57 MB – CC BY 4.0
Ordstatistik:
stats_vivill.csv
2024-06-10 – 6.28 MB – CC BY 4.0
Utforska i:
Svenska tidningar 1818-1870
Ett urval av svenska tidningar tryckta mellan 1818 och 1870 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
Korpus
svenska
Datamängd:
svenska-tidningar-1818-1870.tar.gz
2020-05-26 – 458.22 MB – CC BY 4.0
Svenska tidningar 1871-1906
Ett urval av svenska tidningar tryckta mellan 1871 och 1906 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
Korpus
svenska
Datamängd:
svenska-tidningar-1871-1906.tar.gz
2022-05-03 – 831.74 MB – CC BY 4.0
Svenska Wikipedia
Korpus av svenskspråkiga Wikipedia
Korpus
svenska
Datamängd:
wikipedia-sv.xml.bz2
2023-05-12 – 3.59 GB – CC BY 4.0
Ordstatistik:
stats_wikipedia-sv.csv
2023-05-12 – 2.38 GB – CC BY 4.0
Utforska i:
Svenskt frasnät (SweFN)
En lexikal-semantisk resurs baserad på samma principer som engelska Berkeley FrameNet. Denna del av resursen innehåller de semantiska ramarna och det manuellt annoterade semantiska innehållet.
Lexikon
svenska
Datamängd:
swefn.xml
2021-11-09 – 7 MB – CC BY 4.0
Datamängd:
swefn-full.zip
2021-12-21 – 7.53 MB – CC BY 4.0
Utforska i:
Svenskt frasnät (SweFN)
En lexikalisk-semantisk resurs baserad på samma principer som engelska Berkeley FrameNet. Denna del av resursen innehåller korpusexemplen, automatiskt annoterade med språklig information.
Korpus
svenska
Datamängd:
swefn-ex.xml.bz2
2021-11-25 – 3.62 MB – CC BY 4.0
Ordstatistik:
stats_swefn-ex.csv
2021-11-26 – 1.88 MB – CC BY 4.0
Utforska i:
Svenskt frasnät 2.0 (SweFN)
En lexikal-semantisk resurs baserad på samma principer som engelska Berkeley FrameNet. Denna version är uppdaterad för att motsvara BFN 1.7.
Lexikon
svenska
Datamängd:
swefn-2-0.json.zip
2024-10-16 – 1006.51 KB – CC BY 4.0
Datamängd:
swefn-2-0.tsv.zip
2024-10-16 – 969.61 KB – CC BY 4.0
SveParafras 2.0
Referensdatan för semantisk textjämförelse (STS Benchmark)
Korpus
svenska
Datamängd:
sweparaphrase.zip
2023-03-30 – 750.9 KB – CC BY 4.0
Samling
SVT nyheter
Nyhetstexter från svt.se
Korpus
svenska
Se 21 delresurser
Utforska i:
SVT nyheter 2004
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2004.xml.bz2
2022-12-06 – 12.54 MB – CC BY 4.0
Ordstatistik:
stats_svt-2004.csv
2022-04-26 – 11.18 MB – CC BY 4.0
Utforska i:
SVT nyheter 2005
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2005.xml.bz2
2022-12-06 – 94.29 MB – CC BY 4.0
Ordstatistik:
stats_svt-2005.csv
2022-04-27 – 78.88 MB – CC BY 4.0
Utforska i:
SVT nyheter 2006
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2006.xml.bz2
2022-12-06 – 120.32 MB – CC BY 4.0
Ordstatistik:
stats_svt-2006.csv
2022-04-27 – 93.91 MB – CC BY 4.0
Utforska i:
SVT nyheter 2007
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2007.xml.bz2
2022-12-06 – 159.96 MB – CC BY 4.0
Ordstatistik:
stats_svt-2007.csv
2022-04-27 – 115.85 MB – CC BY 4.0
Utforska i:
SVT nyheter 2008
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2008.xml.bz2
2022-12-06 – 221.24 MB – CC BY 4.0
Ordstatistik:
stats_svt-2008.csv
2022-04-27 – 146.52 MB – CC BY 4.0
Utforska i:
SVT nyheter 2009
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2009.xml.bz2
2022-12-06 – 254.45 MB – CC BY 4.0
Ordstatistik:
stats_svt-2009.csv
2022-04-27 – 160.78 MB – CC BY 4.0
Utforska i:
SVT nyheter 2010
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2010.xml.bz2
2022-12-06 – 284.46 MB – CC BY 4.0
Ordstatistik:
stats_svt-2010.csv
2022-04-27 – 174.12 MB – CC BY 4.0
Utforska i:
SVT nyheter 2011
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2011.xml.bz2
2022-12-06 – 268.69 MB – CC BY 4.0
Ordstatistik:
stats_svt-2011.csv
2022-04-27 – 165.74 MB – CC BY 4.0
Utforska i:
SVT nyheter 2012
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2012.xml.bz2
2022-12-06 – 273.87 MB – CC BY 4.0
Ordstatistik:
stats_svt-2012.csv
2022-04-27 – 162.68 MB – CC BY 4.0
Utforska i:
SVT nyheter 2013
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2013.xml.bz2
2022-12-06 – 397.91 MB – CC BY 4.0
Ordstatistik:
stats_svt-2013.csv
2022-04-27 – 216.85 MB – CC BY 4.0
Utforska i:
SVT nyheter 2014
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2014.xml.bz2
2022-12-07 – 454.63 MB – CC BY 4.0
Ordstatistik:
stats_svt-2014.csv
2022-04-27 – 239.84 MB – CC BY 4.0
Utforska i:
SVT nyheter 2015
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2015.xml.bz2
2022-12-07 – 539.73 MB – CC BY 4.0
Ordstatistik:
stats_svt-2015.csv
2022-04-27 – 269.89 MB – CC BY 4.0
Utforska i:
SVT nyheter 2016
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2016.xml.bz2
2022-12-07 – 613.63 MB – CC BY 4.0
Ordstatistik:
stats_svt-2016.csv
2022-04-27 – 293.12 MB – CC BY 4.0
Utforska i:
SVT nyheter 2017
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2017.xml.bz2
2022-12-07 – 601.37 MB – CC BY 4.0
Ordstatistik:
stats_svt-2017.csv
2022-04-27 – 283.26 MB – CC BY 4.0
Utforska i:
SVT nyheter 2018
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2018.xml.bz2
2022-12-07 – 533.68 MB – CC BY 4.0
Ordstatistik:
stats_svt-2018.csv
2022-04-27 – 263.34 MB – CC BY 4.0
Utforska i:
SVT nyheter 2019
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2019.xml.bz2
2022-12-07 – 515.99 MB – CC BY 4.0
Ordstatistik:
stats_svt-2019.csv
2022-04-27 – 256.88 MB – CC BY 4.0
Utforska i:
SVT nyheter 2020
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2020.xml.bz2
2022-12-07 – 453.02 MB – CC BY 4.0
Ordstatistik:
stats_svt-2020.csv
2022-04-27 – 228.8 MB – CC BY 4.0
Utforska i:
SVT nyheter 2021
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2021.xml.bz2
2022-12-07 – 424.19 MB – CC BY 4.0
Ordstatistik:
stats_svt-2021.csv
2022-04-27 – 220.19 MB – CC BY 4.0
Utforska i:
SVT nyheter 2022
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2022.xml.bz2
2023-08-30 – 395.67 MB – CC BY 4.0
Ordstatistik:
stats_svt-2022.csv
2023-08-30 – 208.8 MB – CC BY 4.0
Utforska i:
SVT nyheter 2023
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-2023.xml.bz2
2023-08-29 – 211.47 MB – CC BY 4.0
Ordstatistik:
stats_svt-2023.csv
2023-08-29 – 119.69 MB – CC BY 4.0
Utforska i:
SVT nyheter okänt datum
Nyhetstexter från svt.se
Korpus
svenska
Datamängd:
svt-nodate.xml.bz2
2023-02-08 – 862.74 KB – CC BY 4.0
Ordstatistik:
stats_svt-nodate.csv
2023-02-09 – 501.94 KB – CC BY 4.0
Utforska i:
SW1203 v1
Korpus
svenska
Ordstatistik:
stats_SW1203V1.txt
2021-07-04 – 363.68 KB – CC BY 4.0
Utforska i:
SW1203-uppsatser
Essays written by L2 Swedish language learners, university courses
Korpus
svenska
Ordstatistik:
stats_SW1203.txt
2018-05-20 – 381.64 KB – CC BY 4.0
Utforska i:
SW1203-uppsatser version 2
Korpus
svenska
Ordstatistik:
stats_SW1203V2.txt
2020-02-26 – 375.63 KB – CC BY 4.0
Utforska i:
Swe-NERC
En resurs för träning och utvärdering av igenkänning av namngiven entitet för svenska.
Korpus
svenska
Datamängd:
Swe-NERC-v1.0.tar.gz
2024-03-05 – 5.74 MB – CC BY 4.0
Swedbergs Swensk ordabok
Swedbergs Swensk Ordabok
Lexikon
svenska, latin
Datamängd:
swedberg.xml
2017-09-19 – 8.89 MB – CC BY 4.0
Utforska i:
Swedbergs Swensk ordabok (morfologi, f.n. rudimentär)
Swedbergs Swensk Ordabok (morfologi, f.n. rudimentär)
Lexikon
svenska
Datamängd:
swedbergm.xml
2017-09-19 – 5.76 MB – CC BY 4.0
Utforska i:
SweDiagnostics
Svenska versionen av (Super)GLUE diagnostik
Korpus
svenska
Datamängd:
swediagnostics.zip
2023-04-04 – 72.89 KB – CC BY 4.0
SweDN 1.0
A Swedish text summarization corpus
Korpus
svenska
Datamängd:
swedn.zip
2023-03-30 – 89.6 MB – CC BY 4.0
SweFAQ 2.0
Vanliga frågor från svenska myndigheters webbsidor med svar i randomiserad ordning
Korpus
svenska
Datamängd:
swefaq.zip
2023-03-30 – 89.81 MB – CC BY 4.0
SweFraCas 1.0
Textual inference/entailment problem set
Korpus
svenska
Datamängd:
swefracas.tsv
2021-06-10 – 100.92 KB – CC BY 4.0
Datamängd:
swefracas_documentation_sheet.tsv
2021-06-15 – 4.23 KB – CC BY 4.0
Samling
SweLL
SweLL -- Swedish Learner Language -- är en samling av SweLL korpusar och derivata resurser med ursprung i dessa korpusar. SweLL korpusar består av elevtexter som skrevs av elever med andra modersmål än svenska (andraspråkskorpusar). Alla texter samlades inom provsituationer (ej hemuppgifter).
Korpus
svenska, flera språk
Se 9 delresurser
SweLL v1 original
Korpus
svenska
Ordstatistik:
stats_SWELLV1-ORIGINAL.txt
2021-08-15 – 760.53 KB – CC BY 4.0
Utforska i:
SweLL v1 target
Korpus
svenska
Ordstatistik:
stats_SWELLV1-TARGET.txt
2021-08-15 – 675.14 KB – CC BY 4.0
Utforska i:
SweLL-gold
Uppsatser skrivna av vuxenstuderande i svenska, manuellt pseudonymiserade och annoterade med felkategorier. Korpusen innehåller både originaltexten och en normaliserad version av varje uppsats. Insamlingperiod 2017-2020.
Korpus
svenska
Utforska i:
SweLL-gold original
Korpus
svenska
Ordstatistik:
stats_SWELL-ORIGINAL.txt
2020-06-07 – 172.29 KB – CC BY 4.0
Utforska i:
SweLL-gold target
Korpus
svenska
Ordstatistik:
stats_SWELL-TARGET.txt
2020-06-07 – 156.58 KB – CC BY 4.0
Utforska i:
Paginering
Första sidan
« Första
Föregående sida
‹ Föregående
Sida
1
Sida
2
Sida
3
Sida
4
Sida
5
Sida
6
Sida
7
Sida
8
Sida
9
Sida
10
Sida
11
Sida
12
Sida
13
Nästa sida
Nästa ›
Sista sidan
Sista »
Aktuellt
Nyheter
Konferenser och workshopar
CLT retreat 2020
AI Trust workshop
CDLC workshop
CLT workshop Spring 2023
EACL 2014
Höstworkshop
Höstworkshop 2025
Höstworkshop 2024
Höstworkshop 2023
Höstworkshop 2022
Höstworkshop 2021
Höstworkshop 2020
Höstworkshop 2011 och Korp-släpp
Höstworkshop 2012
Höstworkshop 2013
Höstworkshop 2014
Höstworkshop 2015
Höstworkshop 2016
Höstworkshop 2017
Höstworkshop 2018
Höstworkshop 2019
Språkbanken 40 år
Korpworkshop
Korpworkshop 2014
Korpworkshop 2018
NoDaLiDa 2017
RESOURCEFUL
SLTC 2020
Programme
Instructions
People
Support
Call for papers
Sustainable language representations
Position statements
Workshop on Profiling second language vocabulary and grammar - 2023
Blogg
Kalender
Tidigare händelser
Forskning
Publikationer
Doktorandutbildning
For PhD students and supervisors
Verktyg
Korp
Användarhandledning
Webb-API
Distribution och utveckling
Korpusstatistik
Nedladdningsbara meningsmängder
Karp
Webb-API
Sparv
Sparvs korpuspipeline
Sparvs användarhandledning
Annotationer från Sparv
Webb-API
Web Sparv
Mink
User manual
Övningsexempel
Web API
Privacy and data policy
Lärka
Övriga verktyg
Catta
IT-baserad grammatikinlärning
Data
Frågelåda
Om oss
Personal
Organisation
Språkbanken Text i världen
Språkbanken 50 år
Jubileumsfirande
En kortfattad historik
Doktorandutbildning
Undervisning
Referera till oss
Alumner
Möten och workshoppar
Workshoppar
End of the year workshop 2024
End of the year workshop 2023
Semester workshop 2022
Semester workshop H2021
Semester workshop V2021
Semester workshop H2020
Semester workshop V2020
Forskningsmöten
Gruppmöten
SBX Retreat
SBX Retreat 2024
SBX Retreat 2023
SBX Retreat 2022
Kakor
Internt
Kontakt
Rådgivning