Hoppa till huvudinnehåll
Svenska
English
Aktuellt
Forskning
Data
Analyser
Plattformar
Frågor och svar
Om oss
Kontakt
Meny
Länkstig
Hem
Datamängder
Datamängder
Datamängder
Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden.
Alla (1367)
Samlingar (31)
Korpusar (1223)
Lexikon (69)
Tränings- och utvärderingsdata (27)
Modeller (48)
Titel
Fri sökning
Språk
- Alla -
svenska
albanska
arabiska
blissymboler
bokmål
bosniska
bulgariska
danska
engelska
estniska
finlandssvenska
finska
flera språk
fornengelska (ca 450-1100)
fornhögtyska (ca 750-1050)
fornisländska
fornsaxiska
franska
färöiska
högsorbiska
iranian persian
isländska
italienska
kele (papua new guinea)
kroatiska
kurdiska
latin
lettiska
lågsorbiska
makedonska
modern greek (1453-)
moliseslaviska
nederländska
norska
polska
portugisiska
rumänska
ryska
serbiska
slovakiska
slovenska
somali
spanska
tjeckiska
turkiska
turkmeniska
tyska
ukrainska
vitryska
xhosa
Resurs
Antal tokens
Språk
Åtkomst
Kubord 2: Ordrelationer Expressen 2023
Del av samlingen Kubord 2
30 703 605
svenska
Ordstatistik:
stats_kubord2-exp-2023.csv.zip
2025-04-30 – 219.48 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Expressen 2024
Del av samlingen Kubord 2
28 680 208
svenska
Ordstatistik:
stats_kubord2-exp-2024.csv.zip
2025-05-15 – 215.98 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Göteborgsposten 2013
Del av samlingen Kubord 2
35 172 089
svenska
Ordstatistik:
stats_kubord2-gp-2013.csv.zip
2025-04-22 – 405.67 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Göteborgsposten 2014
Del av samlingen Kubord 2
41 140 687
svenska
Ordstatistik:
stats_kubord2-gp-2014.csv.zip
2025-04-22 – 469.77 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Göteborgsposten 2015
Del av samlingen Kubord 2
37 781 416
svenska
Ordstatistik:
stats_kubord2-gp-2015.csv.zip
2025-04-22 – 439.79 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Göteborgsposten 2016
Del av samlingen Kubord 2
30 840 113
svenska
Ordstatistik:
stats_kubord2-gp-2016.csv.zip
2025-04-22 – 367.27 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Göteborgsposten 2017
Del av samlingen Kubord 2
29 777 289
svenska
Ordstatistik:
stats_kubord2-gp-2017.csv.zip
2025-04-22 – 357.82 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Göteborgsposten 2018
Del av samlingen Kubord 2
31 021 011
svenska
Ordstatistik:
stats_kubord2-gp-2018.csv.zip
2025-04-22 – 370.45 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Göteborgsposten 2019
Del av samlingen Kubord 2
30 900 679
svenska
Ordstatistik:
stats_kubord2-gp-2019.csv.zip
2025-04-22 – 367.91 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Göteborgsposten 2020
Del av samlingen Kubord 2
27 093 412
svenska
Ordstatistik:
stats_kubord2-gp-2020.csv.zip
2025-04-22 – 318.35 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Göteborgsposten 2021
Del av samlingen Kubord 2
26 926 176
svenska
Ordstatistik:
stats_kubord2-gp-2021.csv.zip
2025-04-22 – 317.55 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Göteborgsposten 2022
Del av samlingen Kubord 2
27 506 663
svenska
Ordstatistik:
stats_kubord2-gp-2022.csv.zip
2025-04-22 – 204.54 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Göteborgsposten 2023
Del av samlingen Kubord 2
27 208 215
svenska
Ordstatistik:
stats_kubord2-gp-2023.csv.zip
2025-04-30 – 200.99 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Göteborgsposten 2024
Del av samlingen Kubord 2
25 111 037
svenska
Ordstatistik:
stats_kubord2-gp-2024.csv.zip
2025-05-15 – 196.28 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2010
Del av samlingen Kubord 2
35 569 612
svenska
Ordstatistik:
stats_kubord2-svd-2010.csv.zip
2025-04-22 – 426.55 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2011
Del av samlingen Kubord 2
37 267 222
svenska
Ordstatistik:
stats_kubord2-svd-2011.csv.zip
2025-04-22 – 439.28 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2012
Del av samlingen Kubord 2
34 337 038
svenska
Ordstatistik:
stats_kubord2-svd-2012.csv.zip
2025-04-22 – 404.65 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2013
Del av samlingen Kubord 2
31 293 680
svenska
Ordstatistik:
stats_kubord2-svd-2013.csv.zip
2025-04-22 – 367.59 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2014
Del av samlingen Kubord 2
32 195 799
svenska
Ordstatistik:
stats_kubord2-svd-2014.csv.zip
2025-04-22 – 377.88 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2015
Del av samlingen Kubord 2
31 155 970
svenska
Ordstatistik:
stats_kubord2-svd-2015.csv.zip
2025-04-22 – 373.54 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2016
Del av samlingen Kubord 2
30 769 788
svenska
Ordstatistik:
stats_kubord2-svd-2016.csv.zip
2025-04-22 – 366.57 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2017
Del av samlingen Kubord 2
30 140 228
svenska
Ordstatistik:
stats_kubord2-svd-2017.csv.zip
2025-04-22 – 358.3 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2018
Del av samlingen Kubord 2
30 465 422
svenska
Ordstatistik:
stats_kubord2-svd-2018.csv.zip
2025-04-22 – 364.22 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2019
Del av samlingen Kubord 2
27 607 664
svenska
Ordstatistik:
stats_kubord2-svd-2019.csv.zip
2025-04-22 – 330.14 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2020
Del av samlingen Kubord 2
26 943 992
svenska
Ordstatistik:
stats_kubord2-svd-2020.csv.zip
2025-04-22 – 323.01 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2021
Del av samlingen Kubord 2
27 265 483
svenska
Ordstatistik:
stats_kubord2-svd-2021.csv.zip
2025-04-22 – 326.98 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2022
Del av samlingen Kubord 2
27 524 626
svenska
Ordstatistik:
stats_kubord2-svd-2022.csv.zip
2025-04-22 – 208.67 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2023
Del av samlingen Kubord 2
26 862 480
svenska
Ordstatistik:
stats_kubord2-svd-2023.csv.zip
2025-04-30 – 202.05 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Svenska Dagbladet 2024
Del av samlingen Kubord 2
25 027 873
svenska
Ordstatistik:
stats_kubord2-svd-2024.csv.zip
2025-05-15 – 199.27 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Sydsvenskan 2013
Del av samlingen Kubord 2
33 470 566
svenska
Ordstatistik:
stats_kubord2-ss-2013.csv.zip
2025-04-22 – 400.01 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Sydsvenskan 2014
Del av samlingen Kubord 2
42 644 505
svenska
Ordstatistik:
stats_kubord2-ss-2014.csv.zip
2025-04-22 – 502.42 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Sydsvenskan 2015
Del av samlingen Kubord 2
43 896 523
svenska
Ordstatistik:
stats_kubord2-ss-2015.csv.zip
2025-04-22 – 512.83 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Sydsvenskan 2016
Del av samlingen Kubord 2
45 168 823
svenska
Ordstatistik:
stats_kubord2-ss-2016.csv.zip
2025-04-22 – 525.66 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Sydsvenskan 2017
Del av samlingen Kubord 2
43 865 362
svenska
Ordstatistik:
stats_kubord2-ss-2017.csv.zip
2025-04-22 – 509.49 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Sydsvenskan 2018
Del av samlingen Kubord 2
43 758 009
svenska
Ordstatistik:
stats_kubord2-ss-2018.csv.zip
2025-04-22 – 509.45 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Sydsvenskan 2019
Del av samlingen Kubord 2
42 338 675
svenska
Ordstatistik:
stats_kubord2-ss-2019.csv.zip
2025-04-22 – 490.49 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Sydsvenskan 2020
Del av samlingen Kubord 2
38 070 847
svenska
Ordstatistik:
stats_kubord2-ss-2020.csv.zip
2025-04-22 – 439.53 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Sydsvenskan 2021
Del av samlingen Kubord 2
40 391 762
svenska
Ordstatistik:
stats_kubord2-ss-2021.csv.zip
2025-04-22 – 458.65 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Sydsvenskan 2022
Del av samlingen Kubord 2
38 939 336
svenska
Ordstatistik:
stats_kubord2-ss-2022.csv.zip
2025-04-22 – 250.69 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Sydsvenskan 2023
Del av samlingen Kubord 2
34 317 593
svenska
Ordstatistik:
stats_kubord2-ss-2023.csv.zip
2025-04-30 – 224.55 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Sydsvenskan 2024
Del av samlingen Kubord 2
32 757 325
svenska
Ordstatistik:
stats_kubord2-ss-2024.csv.zip
2025-05-15 – 225.42 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Östgöta Correspondenten 2013
Del av samlingen Kubord 2
21 696 541
svenska
Ordstatistik:
stats_kubord2-ogc-2013.csv.zip
2025-04-22 – 266.29 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Östgöta Correspondenten 2014
Del av samlingen Kubord 2
21 993 409
svenska
Ordstatistik:
stats_kubord2-ogc-2014.csv.zip
2025-04-22 – 268.75 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Östgöta Correspondenten 2015
Del av samlingen Kubord 2
20 145 730
svenska
Ordstatistik:
stats_kubord2-ogc-2015.csv.zip
2025-04-22 – 249.21 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Östgöta Correspondenten 2016
Del av samlingen Kubord 2
20 957 064
svenska
Ordstatistik:
stats_kubord2-ogc-2016.csv.zip
2025-04-22 – 257.95 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Östgöta Correspondenten 2017
Del av samlingen Kubord 2
21 384 420
svenska
Ordstatistik:
stats_kubord2-ogc-2017.csv.zip
2025-04-22 – 261.92 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Östgöta Correspondenten 2018
Del av samlingen Kubord 2
21 207 648
svenska
Ordstatistik:
stats_kubord2-ogc-2018.csv.zip
2025-04-22 – 260.19 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Östgöta Correspondenten 2019
Del av samlingen Kubord 2
19 785 748
svenska
Ordstatistik:
stats_kubord2-ogc-2019.csv.zip
2025-04-22 – 242.76 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Östgöta Correspondenten 2020
Del av samlingen Kubord 2
17 826 910
svenska
Ordstatistik:
stats_kubord2-ogc-2020.csv.zip
2025-04-22 – 218.59 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Östgöta Correspondenten 2021
Del av samlingen Kubord 2
17 046 977
svenska
Ordstatistik:
stats_kubord2-ogc-2021.csv.zip
2025-04-22 – 212.3 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Östgöta Correspondenten 2022
Del av samlingen Kubord 2
16 602 847
svenska
Ordstatistik:
stats_kubord2-ogc-2022.csv.zip
2025-04-22 – 134.14 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Östgöta Correspondenten 2023
Del av samlingen Kubord 2
14 005 481
svenska
Ordstatistik:
stats_kubord2-ogc-2023.csv.zip
2025-04-30 – 113.56 MB – CC BY 4.0
Utforska i:
Kubord 2: Ordrelationer Östgöta Correspondenten 2024
Del av samlingen Kubord 2
11 886 483
svenska
Ordstatistik:
stats_kubord2-ogc-2024.csv.zip
2025-05-15 – 103.55 MB – CC BY 4.0
Utforska i:
KVAH
Kungl. Vetenskapsakademiens Handlingar
97 717
svenska
Datamängd:
kvah.xml.bz2
2024-01-05 – 1.29 MB – CC BY 4.0
Ordstatistik:
stats_kvah.csv.zip
2025-04-22 – 154.5 KB – CC BY 4.0
Utforska i:
Samling
Kvinnotidningar
Material från äldre svenska kvinnotidskrifter
svenska
Se 7 delresurser
Utforska i:
Kvinnotidningar: Dagny
En korpus med texter från kvinnotidningen Dagny, tidskrift för sociala och literära intressen - utgiven av Frederika-Bremer-Förbundet
8 124 256
svenska
Datamängd:
ub-kvt-dagny.xml.bz2
2015-04-01 – 81.93 MB – CC BY 4.0
Ordstatistik:
stats_UB-KVT-DAGNY.txt.zip
2025-04-22 – 7.17 MB – CC BY 4.0
Utforska i:
Kvinnotidningar: Hertha
En korpus med texter från kvinnotidningen Hertha, tidskrift för den svenska kvinnorörelsen - utgiven av Fredrika-Bremer-Förbundet
3 842 984
svenska
Datamängd:
ub-kvt-hertha.xml.bz2
2015-04-01 – 40.16 MB – CC BY 4.0
Ordstatistik:
stats_UB-KVT-HERTHA.txt.zip
2025-04-22 – 3.61 MB – CC BY 4.0
Utforska i:
Kvinnotidningar: Idun
En korpus med texter från kvinnotidningen Idun, praktisk veckotidning för kvinnan och hemmet
44 944 172
svenska
Datamängd:
ub-kvt-idun.xml.bz2
2015-04-01 – 417.65 MB – CC BY 4.0
Ordstatistik:
stats_UB-KVT-IDUN.txt.zip
2025-04-22 – 10.34 MB – CC BY 4.0
Utforska i:
Kvinnotidningar: Kvinnornas Tidning
En korpus med texter från Kvinnornas Tidning
5 468 918
svenska
Datamängd:
ub-kvt-kvt.xml.bz2
2015-04-01 – 65.01 MB – CC BY 4.0
Ordstatistik:
stats_UB-KVT-KVT.txt.zip
2025-04-22 – 2.08 MB – CC BY 4.0
Utforska i:
Kvinnotidningar: Morgonbris
En korpus med texter från kvinnotidningen Morgonbris, arbeterskornas tidning - utgiven av kvinnornas fackförbund
3 551 943
svenska
Datamängd:
ub-kvt-morgonbris.xml.bz2
2015-04-01 – 36.72 MB – CC BY 4.0
Ordstatistik:
stats_UB-KVT-MORGONBRIS.txt.zip
2025-04-22 – 3.67 MB – CC BY 4.0
Utforska i:
Kvinnotidningar: Rösträtt för Kvinnor
En korpus med texter från kvinnotidningen Rösträtt för Kvinnor, tidning utgiven av landsföreningen för kvinnans politiska rösträtt
2 202 776
svenska
Datamängd:
ub-kvt-rostratt.xml.bz2
2015-04-01 – 24.16 MB – CC BY 4.0
Ordstatistik:
stats_UB-KVT-ROSTRATT.txt.zip
2025-04-22 – 1.9 MB – CC BY 4.0
Utforska i:
Kvinnotidningar: Tidevarvet
En korpus med texter från kvinnotidningen Tidevarvet
6 813 909
svenska
Datamängd:
ub-kvt-tidevarvet.xml.bz2
2015-04-01 – 81.49 MB – CC BY 4.0
Ordstatistik:
stats_UB-KVT-TIDEVARVET.txt.zip
2025-04-22 – 3.65 MB – CC BY 4.0
Utforska i:
Lagar från 1800-talet
Regeringsformen 1809 med ändringar 1809-1974
446 438
svenska
Datamängd:
lag1800.xml.bz2
2015-05-20 – 3.97 MB – CC BY 4.0
Ordstatistik:
stats_LAG1800.txt.zip
2025-04-22 – 467.96 KB – CC BY 4.0
Utforska i:
Lawline
Frågor och svar kring juridisk rådgivning från lawline.
12 002 288
svenska
Ordstatistik:
stats_LAWLINE.txt.zip
2025-04-22 – 2.04 MB – CC BY 4.0
Utforska i:
Samling
Learner Language
Learner Language är en samling av korpusar och lexikala resurser som beskriver inlärarspråket. Korpusar inkluderar både texter/audio som produceras av de som lär sig språket, och texter/språket som de utsätts för (läser eller hör, t.ex. kursböcker). Även en del derivata resurser utifrån dessa korpusar är med i denna samling.
svenska, flera språk
Se 21 delresurser
Linguistic Survey of India (LSI)
1 193 437
engelska
Datamängd:
lsi.xml.bz2
2020-08-25 – 6.23 MB – CC BY 4.0
Utforska i:
Litteraturbanken: fria verk
E-texter och sökbara faksimiler från Litteraturbanken (litteraturbanken.se)
344 688 445
svenska
Datamängd:
lb-open.xml.bz2
2023-11-13 – 5.75 GB – CC BY 4.0
Ordstatistik:
stats_lb-open.csv.zip
2025-04-22 – 43.69 MB – CC BY 4.0
Utforska i:
Litteraturbanken: skyddade verk
E-texter och sökbara faksimiler från Litteraturbanken (litteraturbanken.se)
128 261 903
svenska
Datamängd:
lb-restricted.xml.bz2
2023-10-28 – 2.25 GB – CC BY 4.0
Ordstatistik:
stats_lb-restricted.csv.zip
2025-04-22 – 26.24 MB – CC BY 4.0
Utforska i:
Samling
Läkartidningen
Korpus för vårdens och omsorgens fackspråk
svenska
Se 11 delresurser
Utforska i:
Läkartidningen 1996
Läkartidningens publicerade artiklar under 1996.
2 016 356
svenska
Datamängd:
lt1996.xml.bz2
2017-04-05 – 38.78 MB – CC BY 4.0
Ordstatistik:
stats_LT1996.txt.zip
2025-04-22 – 1.5 MB – CC BY 4.0
Utforska i:
Läkartidningen 1997
Läkartidningens publicerade artiklar under 1997.
1 977 051
svenska
Datamängd:
lt1997.xml.bz2
2017-03-30 – 37.88 MB – CC BY 4.0
Ordstatistik:
stats_LT1997.txt.zip
2025-04-22 – 1.48 MB – CC BY 4.0
Utforska i:
Läkartidningen 1998
Läkartidningens publicerade artiklar under 1998.
2 195 964
svenska
Datamängd:
lt1998.xml.bz2
2017-03-30 – 41.76 MB – CC BY 4.0
Ordstatistik:
stats_LT1998.txt.zip
2025-04-22 – 1.61 MB – CC BY 4.0
Utforska i:
Läkartidningen 1999
Läkartidningens publicerade artiklar under 1999.
2 075 532
svenska
Datamängd:
lt1999.xml.bz2
2017-03-30 – 39.43 MB – CC BY 4.0
Ordstatistik:
stats_LT1999.txt.zip
2025-04-22 – 1.53 MB – CC BY 4.0
Utforska i:
Läkartidningen 2000
Läkartidningens publicerade artiklar under 2000.
2 000 393
svenska
Datamängd:
lt2000.xml.bz2
2017-03-30 – 37.98 MB – CC BY 4.0
Ordstatistik:
stats_LT2000.txt.zip
2025-04-22 – 1.47 MB – CC BY 4.0
Utforska i:
Läkartidningen 2001
Läkartidningens publicerade artiklar under 2001.
2 094 491
svenska
Datamängd:
lt2001.xml.bz2
2017-03-30 – 39.76 MB – CC BY 4.0
Ordstatistik:
stats_LT2001.txt.zip
2025-04-22 – 1.5 MB – CC BY 4.0
Utforska i:
Läkartidningen 2002
Läkartidningens publicerade artiklar under 2002.
2 009 521
svenska
Datamängd:
lt2002.xml.bz2
2017-03-30 – 38.19 MB – CC BY 4.0
Ordstatistik:
stats_LT2002.txt.zip
2025-04-22 – 1.41 MB – CC BY 4.0
Utforska i:
Läkartidningen 2003
Läkartidningens publicerade artiklar under 2003.
1 748 780
svenska
Datamängd:
lt2003.xml.bz2
2017-03-30 – 33.5 MB – CC BY 4.0
Ordstatistik:
stats_LT2003.txt.zip
2025-04-22 – 1.29 MB – CC BY 4.0
Utforska i:
Läkartidningen 2004
Läkartidningens publicerade artiklar under 2004.
1 831 732
svenska
Datamängd:
lt2004.xml.bz2
2017-03-30 – 34.7 MB – CC BY 4.0
Ordstatistik:
stats_LT2004.txt.zip
2025-04-22 – 1.38 MB – CC BY 4.0
Utforska i:
Läkartidningen 2005
Läkartidningens publicerade artiklar under 2005.
1 505 574
svenska
Datamängd:
lt2005.xml.bz2
2017-03-30 – 28.5 MB – CC BY 4.0
Ordstatistik:
stats_LT2005.txt.zip
2025-04-22 – 1.2 MB – CC BY 4.0
Utforska i:
Läkartidningen 2006
Läkartidningens publicerade artiklar under 2006.
1 586 627
svenska
Datamängd:
lt2006.xml.bz2
2017-04-03 – 29.75 MB – CC BY 4.0
Ordstatistik:
stats_LT2006.txt.zip
2025-04-22 – 1.23 MB – CC BY 4.0
Utforska i:
LäSBarT
Lättläst svenska och barnbokstext
1 129 083
svenska
Datamängd:
lasbart.xml.bz2
2017-03-30 – 16.74 MB – CC BY 4.0
Ordstatistik:
stats_LASBART.txt.zip
2025-04-22 – 597.31 KB – CC BY 4.0
Utforska i:
MARB
A dataset for studying Marked Attribute Reporting Bias
engelska
Datamängd:
marb_data.tar.bz2
2025-09-08 – 12.42 MB – MIT License
Datamängd:
marb_code.tar.bz2
2025-09-08 – 15.99 KB – MIT License
Utforska i:
MAÞiR Träd
En fornsvensk trädbank, med lemmata, ordklasser och syntax i stil med PROIEL-korpusarna.
33 721
svenska
Datamängd:
mathir_trees_v0.1.tgz
2024-04-17 – 5.49 MB – CC BY-NC 4.0
Samling
Medeltidsbrev
Svenskt Diplomatariums huvudkartotek över medeltidsbreven (SDHK)
latin, tyska, norska, svenska
Se 5 delresurser
Utforska i:
Medeltidsbrev: Latin
Brev på latin, ur Svenskt Diplomatariums huvudkartotek (SDHK)
2 249 923
latin
Datamängd:
sdhk-latin.xml.bz2
2015-05-20 – 4.71 MB – CC BY 4.0
Ordstatistik:
stats_SDHK-LATIN.txt.zip
2025-04-22 – 699.58 KB – CC BY 4.0
Utforska i:
Medeltidsbrev: Norska
Brev på norska, ur Svenskt Diplomatariums huvudkartotek (SDHK)
27 718
norska
Datamängd:
sdhk-norska.xml.bz2
2015-05-20 – 58.95 KB – CC BY 4.0
Ordstatistik:
stats_SDHK-NORSKA.txt.zip
2025-04-22 – 36.4 KB – CC BY 4.0
Utforska i:
Medeltidsbrev: Svenska
Brev på svenska, ur Svenskt Diplomatariums huvudkartotek (SDHK)
967 228
svenska
Datamängd:
sdhk-svenska.xml.bz2
2014-12-09 – 1.77 MB – CC BY 4.0
Ordstatistik:
stats_SDHK-SVENSKA.txt.zip
2025-04-22 – 495.31 KB – CC BY 4.0
Utforska i:
Medeltidsbrev: Tyska
Brev på tyska, ur Svenskt Diplomatariums huvudkartotek (SDHK)
177 806
tyska
Datamängd:
sdhk-tyska.xml.bz2
2015-05-20 – 335.84 KB – CC BY 4.0
Ordstatistik:
stats_SDHK-TYSKA.txt.zip
2025-04-22 – 97.14 KB – CC BY 4.0
Utforska i:
Medeltidsbrev: Övriga språk
Brev på övriga språk, ur Svenskt Diplomatariums huvudkartotek (SDHK)
39 430
svenska
Datamängd:
sdhk-ovrigt.xml.bz2
2015-05-20 – 91.05 KB – CC BY 4.0
Ordstatistik:
stats_SDHK-OVRIGT.txt.zip
2025-04-22 – 60.19 KB – CC BY 4.0
Utforska i:
MEPAC bloggar
2 738 428
svenska
Ordstatistik:
stats_MEPAC.txt.zip
2025-04-22 – 1.25 MB – CC BY 4.0
Utforska i:
MEPAC intervjuer
331 998
svenska
Ordstatistik:
stats_MEPAC-I.txt.zip
2025-04-22 – 169.61 KB – CC BY 4.0
Utforska i:
MuClaGED
MuClaGED är en datamängd för multi-class Grammatical Error Detection för svenska. Den är baserad på SweLL-gold korpusen.
155 415
svenska
Utforska i:
MultiGEC
MultiGEC är en datamängd för Grammatical Error Correction (uppgift inom NLP) och innehåller parallel data för 12 språk och 17 delkorpusar. Varje delkorpus består av två eller fler varianter av samma texter (oftast uppsatser som skrivs av språkinlärare), där en version (orig) har skrivits av en författare (elev, student, etc.) och de andra versionerna (ref1, ref2, ...) är korrigerade versioner av samma text. Språk som ingår: tjeckiska, engelska, estniska, tyska, grekiska, isländska, italienska, lettiska, ryska, slovenska, svenska och ukrainska (engelska och ryska kan fås på begäran). Texter kommer från olika ursprungskorpusar, men har genomgått omformattering för att ha en gemensam format.
tjeckiska, tyska, modern greek (1453-), engelska, estniska, isländska, italienska, lettiska, ryska, slovenska, svenska, ukrainska
Utforska i:
MultiGED
MultiGED är en datamängd för Grammatical Error Detection (uppgift inom NLP) och innehåller data för 5 språk (tjeckiska, engelska, tyska, italienska och svenska).
tjeckiska, tyska, engelska, italienska, svenska
Datamängd:
multiged-2023.tar.bz2
2025-01-22 – 3.82 MB – varies
Utforska i:
Nils Matsson Kiöpings resor
Reseskildringar från 1674 och 1743
76 209
svenska
Datamängd:
kioping.xml.bz2
2015-05-20 – 761.93 KB – CC BY 4.0
Ordstatistik:
stats_KIOPING.txt.zip
2025-04-22 – 157.78 KB – CC BY 4.0
Utforska i:
Norstedtsromaner (1999)
En samling med 23 romaner utgivna 1999 på Norstedts förlag
2 533 209
svenska
Datamängd:
rom99.xml.bz2
2017-03-17 – 40.83 MB – CC BY 4.0
Ordstatistik:
stats_ROM99.txt.zip
2025-04-22 – 1.48 MB – CC BY 4.0
Utforska i:
NPEGL: Old English
287 756
engelska
Ordstatistik:
stats_NPEGL-ENG.txt.zip
2025-04-22 – 563.11 KB – CC BY 4.0
Utforska i:
NPEGL: Old High German
88 075
tyska
Ordstatistik:
stats_NPEGL-GER.txt.zip
2025-04-22 – 20.41 KB – CC BY 4.0
Utforska i:
NPEGL: Old Icelandic
906 438
isländska
Ordstatistik:
stats_NPEGL-ICE.txt.zip
2025-04-22 – 144.75 KB – CC BY 4.0
Utforska i:
NPEGL: Old Saxon
637 840
Ordstatistik:
stats_NPEGL-SAX.txt.zip
2025-04-22 – 43.95 KB – CC BY 4.0
Utforska i:
Paginering
Första sidan
« Första
Föregående sida
‹ Föregående
Sida
1
Sida
2
Sida
3
Sida
4
Sida
5
Sida
6
Sida
7
Sida
8
Sida
9
Sida
10
Sida
11
Sida
12
Sida
13
Nästa sida
Nästa ›
Sista sidan
Sista »
Aktuellt
Nyheter
Blogg
Kalender
Konferenser och workshopar
CLT retreat 2020
AI Trust workshop
CDLC workshop
CLT workshop Spring 2023
EACL 2014
Höstworkshop
Höstworkshop 2025
Höstworkshop 2024
Höstworkshop 2023
Höstworkshop 2022
Höstworkshop 2021
Höstworkshop 2020
Höstworkshop 2011 och Korp-släpp
Höstworkshop 2012
Höstworkshop 2013
Höstworkshop 2014
Höstworkshop 2015
Höstworkshop 2016
Höstworkshop 2017
Höstworkshop 2018
Höstworkshop 2019
Språkbanken 40 år
Korpworkshop
Korpworkshop 2014
Korpworkshop 2018
NoDaLiDa 2017
RESOURCEFUL
SLTC 2020
Programme
Instructions
People
Support
Call for papers
Sustainable language representations
Position statements
Workshop on Profiling second language vocabulary and grammar - 2023
Forskning
Publikationer
Doktorandutbildning
For PhD students and supervisors
Data
Analyser
Plattformar
Korp
Användarhandledning
Webb-API
Distribution och utveckling
Korpusstatistik
Nedladdningsbara meningsmängder
Karp
Webb-API
Sparv
Webb-Sparv - användarhandledning
Webb-API
Web Sparv - Technical Documentation
Mink
User manual
Övningsexempel
Video: överblick
Web API
Privacy and data policy
Strix
Lärka
Övriga verktyg
Catta
IT-baserad grammatikinlärning
Frågor och svar
Om oss
Personal
Organisation
Språkbanken Text i världen
Språkbanken 50 år
Jubileumsfirande
En kortfattad historik
Studera språkteknologi
Doktorandutbildning
Undervisning
Referera till oss
Alumner
Möten och workshoppar
Workshoppar
End of the year workshop & APT 2025
End of the year workshop 2024
End of the year workshop 2023
Semester workshop 2022
Semester workshop H2021
Semester workshop V2021
Semester workshop H2020
Semester workshop V2020
Forskningsmöten
Gruppmöten
SBX Retreat
SBX Retreat 2024
SBX Retreat 2023
SBX Retreat 2022
Kakor
Internt
Kontakt
Rådgivning