Hoppa till huvudinnehåll
Svenska
English
Aktuellt
Forskning
Data
Analyser
Plattformar
Frågor och svar
Om oss
Kontakt
Meny
Länkstig
Hem
Datamängder
Datamängder
Datamängder
Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden.
Alla (1367)
Samlingar (31)
Korpusar (1223)
Lexikon (69)
Tränings- och utvärderingsdata (27)
Modeller (48)
Titel
Fri sökning
Språk
- Alla -
svenska
albanska
arabiska
blissymboler
bokmål
bosniska
bulgariska
danska
engelska
estniska
finlandssvenska
finska
flera språk
fornengelska (ca 450-1100)
fornhögtyska (ca 750-1050)
fornisländska
fornsaxiska
franska
färöiska
högsorbiska
iranian persian
isländska
italienska
kele (papua new guinea)
kroatiska
kurdiska
latin
lettiska
lågsorbiska
makedonska
modern greek (1453-)
moliseslaviska
nederländska
norska
polska
portugisiska
rumänska
ryska
serbiska
slovakiska
slovenska
somali
spanska
tjeckiska
turkiska
turkmeniska
tyska
ukrainska
vitryska
xhosa
Resurs
Antal tokens
Språk
Åtkomst
1734 års förarbeten
Material från lagkommissionen till 1734 års lag
1 603 126
svenska
Datamängd:
forarbeten1734.xml.bz2
2014-12-08 – 9.11 MB – CC BY 4.0
Ordstatistik:
stats_FORARBETEN1734.txt.zip
2025-04-22 – 750.13 KB – CC BY 4.0
Utforska i:
1734 års lag
Materialet utgörs av balkarna i själva lagtexten, förordet samt domarreglerna. Materialet är inskrivet för hand och korrekturläst, men en del fel finns fortfarande kvar.
98 120
svenska
Datamängd:
lag1734.xml.bz2
2014-09-29 – 565.61 KB – CC BY 4.0
Ordstatistik:
stats_LAG1734.txt.zip
2025-04-22 – 98.62 KB – CC BY 4.0
Utforska i:
8 Sidor
Nyhetsartiklar från 8 SIDOR.
4 998 634
svenska
Datamängd:
attasidor.xml.bz2
2024-03-07 – 150.01 MB – CC BY 4.0
Ordstatistik:
stats_attasidor.csv.zip
2025-04-22 – 1003.21 KB – CC BY 4.0
Utforska i:
Af Soomaali 1993-94
9 247
somali
Datamängd:
somali-1993-94.xml.bz2
2024-01-04 – 19.45 KB – CC BY 4.0
Utforska i:
Af-Soomaali 2016 Somaliland
51 236
somali
Datamängd:
somali-as-2016.xml.bz2
2024-01-04 – 109.54 KB – CC BY 4.0
Utforska i:
Aftonbladet 1830-talet
Del av samlingen Kubhist2
29 870 739
svenska
Datamängd:
kubhist2-aftonbladet-1830.xml.bz2
2024-01-14 – 1.02 GB – CC BY 4.0
Ordstatistik:
stats_kubhist2-aftonbladet-1830.csv.zip
2025-04-22 – 15.94 MB – CC BY 4.0
Utforska i:
Akademiliv
2 299 155
svenska
Datamängd:
akademiliv.xml.bz2
2025-09-09 – 46.39 MB – CC BY 4.0
Ordstatistik:
stats_akademiliv.csv.zip
2025-09-09 – 1.4 MB – CC BY 4.0
Utforska i:
Akademiliv (engelska)
Akademiliv är Sahlgrenska akademins personaltidning på nätet. Denna korpus innehåller de engelska versionerna av artiklarna.
1 692 407
engelska
Datamängd:
akademiliv-eng.xml.bz2
2025-09-11 – 8.59 MB – CC BY 4.0
Ordstatistik:
stats_akademiliv-eng.csv.zip
2025-09-11 – 412 KB – CC BY 4.0
Utforska i:
Akademiska texter: Humaniora
En korpus med akademiska texter
14 454 573
svenska
Datamängd:
sweachum.xml.bz2
2017-05-19 – 208.67 MB – CC BY 4.0
Ordstatistik:
stats_SWEACHUM.txt.zip
2025-04-22 – 5.43 MB – CC BY 4.0
Utforska i:
Akademiska texter: Samhällsvetenskap
En korpus med akademiska texter
10 855 954
svenska
Datamängd:
sweacsam.xml.bz2
2017-06-07 – 157.41 MB – CC BY 4.0
Ordstatistik:
stats_SWEACSAM.txt.zip
2025-04-22 – 3.9 MB – CC BY 4.0
Utforska i:
Arabisk e-bokskorpus
En samling av 1 745 böcker på arabiska.
76 486 597
arabiska
Datamängd:
arabic-ebooks.xml.bz2
2025-09-12 – 142.88 MB – CC BY 4.0
Utforska i:
Argumentation sentences 1.0
A translated corpus for classifying sentence stance in relation to a topic.
svenska
Datamängd:
argumentation-sentences.zip
2023-03-30 – 827.04 KB – CC BY 4.0
Samling
ASPAC
The Amsterdam Slavic Parallel Aligned Corpus
svenska, vitryska, bulgariska, tjeckiska, tyska, lågsorbiska, modern greek (1453-), engelska, spanska, franska, kroatiska, högsorbiska, latin, makedonska, nederländska, polska, portugisiska, rumänska, ryska, kele (papua new guinea), slovakiska, slovenska, serbiska, moliseslaviska, turkmeniska, ukrainska
Se 27 delresurser
Utforska i:
ASPAC: svenska
Svenska delen av The Amsterdam Slavic Parallel Aligned Corpus
773 703
svenska
Datamängd:
aspacsv.xml.bz2
2021-07-08 – 14.28 MB – CC BY 4.0
Ordstatistik:
stats_aspacsv.csv.zip
2025-04-22 – 744.87 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-belarusiska
Del av The Amsterdam Slavic Parallel Aligned Corpus
401 158
svenska, vitryska
Datamängd:
aspacsvbe-sv.xml.bz2
2016-11-03 – 2.33 MB – CC BY 4.0
Datamängd:
aspacsvbe-be.xml.bz2
2016-11-03 – 772.78 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVBE-SV.txt.zip
2025-04-22 – 208.66 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVBE-BE.txt.zip
2025-04-22 – 159.59 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-bulgariska
Del av The Amsterdam Slavic Parallel Aligned Corpus
667 092
svenska, bulgariska
Datamängd:
aspacsvbg-sv.xml.bz2
2016-11-02 – 4.08 MB – CC BY 4.0
Datamängd:
aspacsvbg-bg.xml.bz2
2016-11-02 – 1.83 MB – CC BY 4.0
Ordstatistik:
stats_ASPACSVBG-SV.txt.zip
2025-04-22 – 333.21 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVBG-BG.txt.zip
2025-04-22 – 223.75 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-engelska
Del av The Amsterdam Slavic Parallel Aligned Corpus
1 516 943
svenska, engelska
Datamängd:
aspacsven-sv.xml.bz2
2016-11-25 – 9.1 MB – CC BY 4.0
Datamängd:
aspacsven-en.xml.bz2
2016-11-25 – 3.87 MB – CC BY 4.0
Ordstatistik:
stats_ASPACSVEN-SV.txt.zip
2025-04-22 – 600.92 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVEN-EN.txt.zip
2025-04-22 – 217.15 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-franska
Del av The Amsterdam Slavic Parallel Aligned Corpus
341 914
svenska, franska
Datamängd:
aspacsvfr-sv.xml.bz2
2016-11-25 – 1.95 MB – CC BY 4.0
Datamängd:
aspacsvfr-fr.xml.bz2
2016-11-25 – 1008.92 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVFR-SV.txt.zip
2025-04-22 – 212.9 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVFR-FR.txt.zip
2025-04-22 – 98.46 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-grekiska
Del av The Amsterdam Slavic Parallel Aligned Corpus
303 518
modern greek (1453-), svenska
Datamängd:
aspacsvel-sv.xml.bz2
2016-11-02 – 1.94 MB – CC BY 4.0
Datamängd:
aspacsvel-el.xml.bz2
2016-11-03 – 570.94 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVEL-SV.txt.zip
2025-04-22 – 212.82 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVEL-EL.txt.zip
2025-04-22 – 103.08 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-högsorbiska
Del av The Amsterdam Slavic Parallel Aligned Corpus
85 146
svenska, högsorbiska
Datamängd:
aspacsvhsb-sv.xml.bz2
2016-11-03 – 476.11 KB – CC BY 4.0
Datamängd:
aspacsvhsb-hsb.xml.bz2
2016-11-03 – 162.79 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVHSB-SV.txt.zip
2025-04-22 – 63.76 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVHSB-HSB.txt.zip
2025-04-22 – 35.7 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-italienska
Del av The Amsterdam Slavic Parallel Aligned Corpus
91 166
svenska, italienska
Datamängd:
aspacsvit-sv.xml.bz2
2016-11-25 – 519.56 KB – CC BY 4.0
Datamängd:
aspacsvit-it.xml.bz2
2016-11-25 – 249.64 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVIT-SV.txt.zip
2025-04-22 – 71.95 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVIT-IT.txt.zip
2025-04-22 – 38.03 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-kroatiska
Del av The Amsterdam Slavic Parallel Aligned Corpus
992 471
svenska, kroatiska
Datamängd:
aspacsvhr-sv.xml.bz2
2016-11-02 – 6.08 MB – CC BY 4.0
Datamängd:
aspacsvhr-hr.xml.bz2
2016-11-03 – 1.88 MB – CC BY 4.0
Ordstatistik:
stats_ASPACSVHR-SV.txt.zip
2025-04-22 – 487.15 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVHR-HR.txt.zip
2025-04-22 – 263.42 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-latin
Del av The Amsterdam Slavic Parallel Aligned Corpus
134 180
svenska, latin
Datamängd:
aspacsvla-sv.xml.bz2
2016-11-03 – 792.29 KB – CC BY 4.0
Datamängd:
aspacsvla-la.xml.bz2
2016-11-03 – 372.16 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVLA-SV.txt.zip
2025-04-22 – 91.89 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVLA-LA.txt.zip
2025-04-22 – 70.25 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-logsorbiska
Del av The Amsterdam Slavic Parallel Aligned Corpus
36 551
svenska, lågsorbiska
Datamängd:
aspacsvdsb-sv.xml.bz2
2016-11-03 – 195.53 KB – CC BY 4.0
Datamängd:
aspacsvdsb-dsb.xml.bz2
2016-11-03 – 72.76 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVDSB-SV.txt.zip
2025-04-22 – 37.25 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVDSB-DSB.txt.zip
2025-04-22 – 19.67 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-makedonska
Del av The Amsterdam Slavic Parallel Aligned Corpus
602 313
svenska, makedonska
Datamängd:
aspacsvmk-sv.xml.bz2
2016-11-02 – 3.76 MB – CC BY 4.0
Datamängd:
aspacsvmk-mk.xml.bz2
2016-11-03 – 1.06 MB – CC BY 4.0
Ordstatistik:
stats_ASPACSVMK-SV.txt.zip
2025-04-22 – 320.57 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVMK-MK.txt.zip
2025-04-22 – 145.92 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-moliseslaviska
Del av The Amsterdam Slavic Parallel Aligned Corpus
35 279
moliseslaviska, svenska
Datamängd:
aspacsvsvm-sv.xml.bz2
2016-11-03 – 194.99 KB – CC BY 4.0
Datamängd:
aspacsvsvm-svm.xml.bz2
2016-11-03 – 63.89 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVSVM-SV.txt.zip
2025-04-22 – 37.34 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVSVM-SVM.txt.zip
2025-04-22 – 13.57 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-nederländska
Del av The Amsterdam Slavic Parallel Aligned Corpus
1 549 106
svenska, nederländska
Datamängd:
aspacsvnl-sv.xml.bz2
2016-11-02 – 9.03 MB – CC BY 4.0
Datamängd:
aspacsvnl-nl.xml.bz2
2016-11-03 – 4.02 MB – CC BY 4.0
Ordstatistik:
stats_ASPACSVNL-SV.txt.zip
2025-04-22 – 601.03 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVNL-NL.txt.zip
2025-04-22 – 244.56 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-polska
Del av The Amsterdam Slavic Parallel Aligned Corpus
1 467 390
svenska, polska
Datamängd:
aspacsvpl-sv.xml.bz2
2016-11-02 – 9.04 MB – CC BY 4.0
Datamängd:
aspacsvpl-pl.xml.bz2
2016-11-02 – 4.44 MB – CC BY 4.0
Ordstatistik:
stats_ASPACSVPL-SV.txt.zip
2025-04-22 – 601.08 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVPL-PL.txt.zip
2025-04-22 – 622.81 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-portugisiska
Del av The Amsterdam Slavic Parallel Aligned Corpus
270 241
svenska, portugisiska
Datamängd:
aspacsvpt-sv.xml.bz2
2016-11-25 – 1.55 MB – CC BY 4.0
Datamängd:
aspacsvpt-pt.xml.bz2
2016-11-03 – 770.36 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVPT-SV.txt.zip
2025-04-22 – 162.99 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVPT-PT.txt.zip
2025-04-22 – 78.35 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-rumänska
Del av The Amsterdam Slavic Parallel Aligned Corpus
93 861
svenska, rumänska
Datamängd:
aspacsvro-sv.xml.bz2
2016-11-03 – 517.08 KB – CC BY 4.0
Datamängd:
aspacsvro-ro.xml.bz2
2016-11-02 – 276.74 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVRO-SV.txt.zip
2025-04-22 – 72.07 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVRO-RO.txt.zip
2025-04-22 – 48.05 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-ryska
Del av The Amsterdam Slavic Parallel Aligned Corpus
1 466 745
svenska, ryska
Datamängd:
aspacsvru-sv.xml.bz2
2016-11-28 – 9.08 MB – CC BY 4.0
Datamängd:
aspacsvru-ru.xml.bz2
2016-11-28 – 4.41 MB – CC BY 4.0
Ordstatistik:
stats_ASPACSVRU-SV.txt.zip
2025-04-22 – 600.94 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVRU-RU.txt.zip
2025-04-22 – 606.22 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-serbiska (kyrilliskt)
Del av The Amsterdam Slavic Parallel Aligned Corpus
577 094
serbiska, svenska
Datamängd:
aspacsvsbc-sv.xml.bz2
2016-11-03 – 3.47 MB – CC BY 4.0
Datamängd:
aspacsvsbc-sbc.xml.bz2
2016-11-03 – 1006.26 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVSBC-SV.txt.zip
2025-04-22 – 261.57 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVSBC-SBC.txt.zip
2025-04-22 – 158.03 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-serbiska (latin)
Del av The Amsterdam Slavic Parallel Aligned Corpus
505 216
svenska, serbiska
Datamängd:
aspacsvsr-sv.xml.bz2
2016-11-03 – 3.11 MB – CC BY 4.0
Datamängd:
aspacsvsr-sr.xml.bz2
2016-11-03 – 956.03 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVSR-SV.txt.zip
2025-04-22 – 290.19 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVSR-SR.txt.zip
2025-04-22 – 157.76 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-slovakiska
Del av The Amsterdam Slavic Parallel Aligned Corpus
554 510
svenska, slovakiska
Datamängd:
aspacsvsk-sv.xml.bz2
2016-11-02 – 3.41 MB – CC BY 4.0
Datamängd:
aspacsvsk-sk.xml.bz2
2016-11-03 – 1.56 MB – CC BY 4.0
Ordstatistik:
stats_ASPACSVSK-SV.txt.zip
2025-04-22 – 303.42 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVSK-SK.txt.zip
2025-04-22 – 224.29 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-slovenska
Del av The Amsterdam Slavic Parallel Aligned Corpus
579 527
svenska, slovenska
Datamängd:
aspacsvsl-sv.xml.bz2
2016-11-03 – 3.44 MB – CC BY 4.0
Datamängd:
aspacsvsl-sl.xml.bz2
2016-11-02 – 1.69 MB – CC BY 4.0
Ordstatistik:
stats_ASPACSVSL-SV.txt.zip
2025-04-22 – 303.42 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVSL-SL.txt.zip
2025-04-22 – 221.03 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-spanska
Del av The Amsterdam Slavic Parallel Aligned Corpus
61 931
svenska, spanska
Datamängd:
aspacsves-sv.xml.bz2
2016-11-03 – 325.61 KB – CC BY 4.0
Datamängd:
aspacsves-es.xml.bz2
2016-11-03 – 145.87 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVES-SV.txt.zip
2025-04-22 – 48.3 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVES-ES.txt.zip
2025-04-22 – 22.14 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-tjeckiska
Del av The Amsterdam Slavic Parallel Aligned Corpus
1 438 880
svenska, tjeckiska
Datamängd:
aspacsvcs-sv.xml.bz2
2016-11-03 – 9.03 MB – CC BY 4.0
Datamängd:
aspacsvcs-cs.xml.bz2
2016-11-03 – 2.68 MB – CC BY 4.0
Ordstatistik:
stats_ASPACSVCS-SV.txt.zip
2025-04-22 – 600.87 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVCS-CS.txt.zip
2025-04-22 – 386.15 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-turkmeniska
Del av The Amsterdam Slavic Parallel Aligned Corpus
31 397
svenska, turkmeniska
Datamängd:
aspacsvtk-sv.xml.bz2
2016-11-02 – 196.79 KB – CC BY 4.0
Datamängd:
aspacsvtk-tk.xml.bz2
2016-11-03 – 61.13 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVTK-SV.txt.zip
2025-04-22 – 37.29 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVTK-TK.txt.zip
2025-04-22 – 22.49 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-tyska
Del av The Amsterdam Slavic Parallel Aligned Corpus
1 580 660
svenska, tyska
Datamängd:
aspacsvde-sv.xml.bz2
2016-10-31 – 9.07 MB – CC BY 4.0
Datamängd:
aspacsvde-de.xml.bz2
2016-10-31 – 4.64 MB – CC BY 4.0
Ordstatistik:
stats_ASPACSVDE-SV.txt.zip
2025-04-22 – 600.6 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVDE-DE.txt.zip
2025-04-22 – 417.33 KB – CC BY 4.0
Utforska i:
ASPAC: svenska-ukrainska
Del av The Amsterdam Slavic Parallel Aligned Corpus
453 836
svenska, ukrainska
Datamängd:
aspacsvuk-sv.xml.bz2
2016-11-02 – 2.67 MB – CC BY 4.0
Datamängd:
aspacsvuk-uk.xml.bz2
2016-11-03 – 869.41 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVUK-SV.txt.zip
2025-04-22 – 227.62 KB – CC BY 4.0
Ordstatistik:
stats_ASPACSVUK-UK.txt.zip
2025-04-22 – 187.91 KB – CC BY 4.0
Utforska i:
ASU
Andraspråkets strukturutveckling
643 949
svenska
Ordstatistik:
stats_asu.csv.zip
2025-04-22 – 411.64 KB – CC BY 4.0
Utforska i:
August Strindbergs brev
Del av August Strindbergs samlade verk
1 507 958
svenska
Datamängd:
strindbergbrev.xml.bz2
2017-04-26 – 20.39 MB – CC BY 4.0
Ordstatistik:
stats_STRINDBERGBREV.txt.zip
2025-04-22 – 1.12 MB – CC BY 4.0
Utforska i:
August Strindbergs romaner
Del av August Strindbergs samlade verk
4 309 037
svenska
Datamängd:
strindbergromaner.xml.bz2
2017-06-20 – 63.43 MB – CC BY 4.0
Ordstatistik:
stats_STRINDBERGROMANER.txt.zip
2025-04-22 – 2.26 MB – CC BY 4.0
Utforska i:
Banco de Datos de Once Novelas Españolas 1951–1971
Korpus med elva spanska romaner. Del av SOL - Spanska Online.
1 248 184
spanska
Datamängd:
one71.xml.bz2
2017-11-10 – 3.68 MB – CC BY 4.0
Utforska i:
Banco de Datos de Prensa Española 1977
Texter från två spanska tidningar från 1977. Del av SOL - Spanska Online.
2 166 383
spanska
Datamängd:
pe77.xml.bz2
2017-11-10 – 7.7 MB – CC BY 4.0
Utforska i:
Bellman
C.M. Bellmans samlade verk
452 030
svenska
Datamängd:
bellman.xml.bz2
2015-11-09 – 4.83 MB – CC BY 4.0
Ordstatistik:
stats_BELLMAN.txt.zip
2025-04-22 – 489.31 KB – CC BY 4.0
Utforska i:
Besvarade språkfrågor
Spåkrådets rådgivningsmejl
20 083 415
svenska
Utforska i:
Betänkande ang. läroböcker (1882)
Göteborgs universitetsbiblioteks OCR-lästa men ej korrekturlästa digitalisering av ett betänkande från 1882
41 521
svenska
Datamängd:
betankande.xml.bz2
2015-12-11 – 403.44 KB – CC BY 4.0
Ordstatistik:
stats_BETANKANDE.txt.zip
2025-04-22 – 71.87 KB – CC BY 4.0
Utforska i:
Bibeln 1873
Språkligt uppdaterad version från 1873 av den svenska Bibeln från 1703
811 321
svenska
Datamängd:
bibel1873dalin.xml.bz2
2015-05-20 – 5.84 MB – CC BY 4.0
Ordstatistik:
stats_BIBEL1873DALIN.txt.zip
2025-04-22 – 306.18 KB – CC BY 4.0
Utforska i:
Bibeln 1917
Officiell svensk översättning av Bibeln från 1917
894 720
svenska
Datamängd:
bibel1917.xml.bz2
2015-05-19 – 7.5 MB – CC BY 4.0
Ordstatistik:
stats_BIBEL1917.txt.zip
2025-04-22 – 359.83 KB – CC BY 4.0
Utforska i:
Biblioteksbladet
Projekt Runebergs elektroniska utgåva av de äldsta årgångarna av "Biblioteksbladet: Organ för Sveriges allmänna biblioteksförening", 1916–1940
4 595 593
svenska
Datamängd:
runeberg-biblblad.xml.bz2
2015-05-19 – 52.49 MB – CC BY 4.0
Ordstatistik:
stats_RUNEBERG-BIBLBLAD.txt.zip
2025-04-22 – 2.79 MB – CC BY 4.0
Utforska i:
Samling
Bloggmix
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
svenska
Se 21 delresurser
Utforska i:
Bloggmix 1998
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
30 939
svenska
Datamängd:
bloggmix1998.xml.bz2
2017-02-14 – 453.05 KB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX1998.txt.zip
2025-04-22 – 83.09 KB – CC BY 4.0
Utforska i:
Bloggmix 1999
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
604 019
svenska
Datamängd:
bloggmix1999.xml.bz2
2017-02-14 – 9.27 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX1999.txt.zip
2025-04-22 – 569.59 KB – CC BY 4.0
Utforska i:
Bloggmix 2000
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
188 779
svenska
Datamängd:
bloggmix2000.xml.bz2
2017-02-22 – 2.69 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2000.txt.zip
2025-04-22 – 263.39 KB – CC BY 4.0
Utforska i:
Bloggmix 2001
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
326 659
svenska
Datamängd:
bloggmix2001.xml.bz2
2017-02-14 – 4.7 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2001.txt.zip
2025-04-22 – 424.02 KB – CC BY 4.0
Utforska i:
Bloggmix 2002
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
242 723
svenska
Datamängd:
bloggmix2002.xml.bz2
2017-02-14 – 3.4 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2002.txt.zip
2025-04-22 – 319.44 KB – CC BY 4.0
Utforska i:
Bloggmix 2003
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
271 877
svenska
Datamängd:
bloggmix2003.xml.bz2
2017-02-14 – 3.76 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2003.txt.zip
2025-04-22 – 377.79 KB – CC BY 4.0
Utforska i:
Bloggmix 2004
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
638 967
svenska
Datamängd:
bloggmix2004.xml.bz2
2017-02-14 – 9.03 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2004.txt.zip
2025-04-22 – 593.74 KB – CC BY 4.0
Utforska i:
Bloggmix 2005
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
4 800 032
svenska
Datamängd:
bloggmix2005.xml.bz2
2017-02-14 – 70.01 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2005.txt.zip
2025-04-22 – 2.3 MB – CC BY 4.0
Utforska i:
Bloggmix 2006
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
8 106 551
svenska
Datamängd:
bloggmix2006.xml.bz2
2017-02-15 – 123.62 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2006.txt.zip
2025-04-22 – 3.5 MB – CC BY 4.0
Utforska i:
Bloggmix 2007
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
19 096 258
svenska
Datamängd:
bloggmix2007.xml.bz2
2017-02-15 – 288.92 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2007.txt.zip
2025-04-22 – 5.78 MB – CC BY 4.0
Utforska i:
Bloggmix 2008
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
43 703 790
svenska
Datamängd:
bloggmix2008.xml.bz2
2017-02-16 – 656.67 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2008.txt.zip
2025-04-22 – 9.46 MB – CC BY 4.0
Utforska i:
Bloggmix 2009
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
75 113 677
svenska
Datamängd:
bloggmix2009.xml.bz2
2017-02-17 – 1.1 GB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2009.txt.zip
2025-04-22 – 12.95 MB – CC BY 4.0
Utforska i:
Bloggmix 2010
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
97 435 693
svenska
Datamängd:
bloggmix2010.xml.bz2
2017-02-23 – 1.44 GB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2010.txt.zip
2025-04-22 – 15.57 MB – CC BY 4.0
Utforska i:
Bloggmix 2011
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
100 591 617
svenska
Datamängd:
bloggmix2011.xml.bz2
2017-02-24 – 1.48 GB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2011.txt.zip
2025-04-22 – 15.45 MB – CC BY 4.0
Utforska i:
Bloggmix 2012
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
80 041 223
svenska
Datamängd:
bloggmix2012.xml.bz2
2017-02-23 – 1.17 GB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2012.txt.zip
2025-04-22 – 12.92 MB – CC BY 4.0
Utforska i:
Bloggmix 2013
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
62 098 899
svenska
Datamängd:
bloggmix2013.xml.bz2
2017-02-24 – 930.12 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2013.txt.zip
2025-04-22 – 10.71 MB – CC BY 4.0
Utforska i:
Bloggmix 2014
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
40 133 589
svenska
Datamängd:
bloggmix2014.xml.bz2
2017-02-23 – 596.24 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2014.txt.zip
2025-04-22 – 8 MB – CC BY 4.0
Utforska i:
Bloggmix 2015
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
27 835 518
svenska
Datamängd:
bloggmix2015.xml.bz2
2017-05-10 – 434.91 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2015.txt.zip
2025-04-22 – 6.49 MB – CC BY 4.0
Utforska i:
Bloggmix 2016
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
17 699 703
svenska
Datamängd:
bloggmix2016.xml.bz2
2017-02-22 – 262.98 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2016.txt.zip
2025-04-22 – 4.97 MB – CC BY 4.0
Utforska i:
Bloggmix 2017
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
1 669 477
svenska
Datamängd:
bloggmix2017.xml.bz2
2017-02-22 – 23.48 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2017.txt.zip
2025-04-22 – 1.21 MB – CC BY 4.0
Utforska i:
Bloggmix okänt datum
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
35 028 559
svenska
Datamängd:
bloggmixodat.xml.bz2
2017-02-23 – 511.42 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIXODAT.txt.zip
2025-04-22 – 7.77 MB – CC BY 4.0
Utforska i:
Bonniersromaner I (1976–77)
En korpus med 69 Bonniersromaner från 1976–77
6 578 675
svenska
Datamängd:
romi.xml.bz2
2017-10-04 – 135.42 MB – CC BY 4.0
Ordstatistik:
stats_ROMI.txt.zip
2025-04-22 – 2.52 MB – CC BY 4.0
Utforska i:
Bonniersromaner II (1980–81)
En korpus med 60 Bonniersromaner från 1980–81
4 304 271
svenska
Datamängd:
romii.xml.bz2
2017-03-17 – 62.87 MB – CC BY 4.0
Ordstatistik:
stats_ROMII.txt.zip
2025-04-22 – 2.21 MB – CC BY 4.0
Utforska i:
Caafimaad 1983
1 521
somali
Datamängd:
somali-caafimaad-1983.xml.bz2
2024-01-15 – 4.48 KB – CC BY 4.0
Utforska i:
COCTAILL
Korpus av kursböcker för undervisning av L2-svenska. Annoterade manuellt för textstruktur och pedagogiska/didaktiska kategorier; automatiskt uppmärkt med språkvetenskapliga annoteringar. Se mer här https://spraakbanken.gu.se/forskning/teman/icall/icall-l2-projects/l2-data
710 251
svenska
Datamängd:
coctaill.xml.bz2
2017-10-30 – 16.57 MB – CC BY 4.0
Ordstatistik:
stats_COCTAILL.txt.zip
2025-04-22 – 621.39 KB – CC BY 4.0
Utforska i:
COCTAILL activities & examples
Korpus av kursböcker för undervisning av L2-svenska. Annoterade manuellt för textstruktur och pedagogiska/didaktiska kategorier; automatiskt uppmärkt med språkvetenskapliga annoteringar.
343 793
svenska
Ordstatistik:
stats_COCTAILL-AE.txt.zip
2025-04-22 – 352 KB – CC BY 4.0
Utforska i:
COCTAILL lesson text
Korpus av kursböcker för undervisning av L2-svenska. Annoterade manuellt för textstruktur och pedagogiska/didaktiska kategorier; automatiskt uppmärkt med språkvetenskapliga annoteringar.
308 206
svenska
Ordstatistik:
stats_COCTAILL-LT.txt.zip
2025-04-22 – 379.61 KB – CC BY 4.0
Utforska i:
Corpus of spoken isiXhosa
A corpus of transcribed and annotated recordings of spoken Xhosa.
8 688
xhosa
Datamängd:
xhosa.xml.bz2
2025-06-23 – 284.37 KB – CC BY 4.0
Utforska i:
Corpus Oral de Referencia del Español Contemporáneo
Korpus med transkriptioner från inspelade ljudband från 1991 till 1992. Del av SOL - Spanska Online
1 200 830
spanska
Datamängd:
cor92.xml.bz2
2017-11-10 – 2.33 MB – CC BY 4.0
Utforska i:
Dagens Arena
Nyhetstexter från dagensarena.se
8 482 409
svenska
Datamängd:
da.xml.bz2
2025-05-09 – 233.44 MB – CC BY 4.0
Ordstatistik:
stats_da.csv.zip
2025-04-22 – 21.95 MB – CC BY 4.0
Utforska i:
DaLAJ-GED-Superlim 2.0
Dataset for Linguistic Acceptability Judgments (and more), v.2.0
svenska
Datamängd:
dalaj-ged-superlim.zip
2023-04-03 – 1.41 MB – CC BY 4.0
Datamängd:
dalaj-ged-tsv.zip
2023-05-20 – 1.15 MB – CC BY 4.0
Datamängd:
liuep197-11.pdf
2024-01-25 – 463.74 KB – CC BY 4.0
Dalin: Then Swänska Argus 1732-1734
Manuell transkription av Then Swänska Argus av Olof von Dalin, Stockholm, 1732–1734. För OCR analys.
213 399
svenska
Datamängd:
dalin-then-swaanska-argus-1732-1734.tar.gz
2020-06-12 – 80.21 MB – CC BY 4.0
Dalpilen 1860-talet
Del av samlingen Kubhist2
8 984 628
svenska
Datamängd:
kubhist2-dalpilen-1860.xml.bz2
2024-01-09 – 273.1 MB – CC BY 4.0
Ordstatistik:
stats_kubhist2-dalpilen-1860.csv.zip
2025-04-22 – 4.94 MB – CC BY 4.0
Utforska i:
Detektiva avdelningen
Data från Detektiva avdelningen vid Göteborgs poliskammare, från slutet av 1800-talet till början av 1900-talet.
svenska
Datamängd:
geocoords.txt
2023-06-20 – 326.73 KB – CC BY 4.0
Datamängd:
pixelcoords.txt
2023-06-20 – 182.83 KB – CC BY 4.0
Detektiva avdelningen
1 343 709
svenska
Datamängd:
detektivaavdelningen.xml.bz2
2024-03-13 – 20.95 MB – CC BY 4.0
Ordstatistik:
stats_detektivaavdelningen.csv.zip
2025-04-22 – 501.47 KB – CC BY 4.0
Utforska i:
DiabetologNytt (1996–1999)
Tidningen DiabetologNytt 1996-1999
228 313
svenska
Utforska i:
Diverse tidningar
Fjorton årgångar av åtta olika tidsskrifter (1810–1933) som digitiserats av Projekt Runeberg
5 358 564
svenska
Datamängd:
runeberg-diverse.xml.bz2
2014-12-08 – 65.51 MB – CC BY 4.0
Ordstatistik:
stats_RUNEBERG-DIVERSE.txt.zip
2025-04-22 – 4.49 MB – CC BY 4.0
Utforska i:
DN 1987
Dagens Nyheter 1987
5 129 248
svenska
Datamängd:
dn1987.xml.bz2
2022-12-13 – 137.38 MB – CC BY 4.0
Ordstatistik:
stats_dn1987.csv.zip
2025-04-22 – 4.45 MB – CC BY 4.0
Utforska i:
Domar
32 206 334
svenska
Datamängd:
moderntdv.xml.bz2
2015-05-20 – 295.47 MB – CC BY 4.0
Ordstatistik:
stats_MODERNTDV.txt.zip
2025-04-22 – 4.25 MB – CC BY 4.0
Utforska i:
Dramawebben (demo)
Texter från Dramawebben, ett digitalt arkiv över fri svensk dramatik.
790 456
svenska
Datamängd:
drama.xml.bz2
2017-03-21 – 9.1 MB – CC BY 4.0
Ordstatistik:
stats_DRAMA.txt.zip
2025-04-22 – 524.87 KB – CC BY 4.0
Utforska i:
DReaM
En flerspråkig korpus av språkliga beskrivningar av världens naturliga språk.
75 027 790
engelska
Datamängd:
dream.zip.bz2
2020-11-11 – 188.83 MB – CC BY 4.0
Utforska i:
DReaM-Copyright-Protected
En flerspråkig korpus av språkliga beskrivningar av världens naturliga språk.
225 617 801
engelska
DReaM-de-open
18 619 718
tyska
Ordstatistik:
stats_DREAM-DE-OPEN.txt.zip
2025-04-22 – 14.28 MB – CC BY 4.0
Utforska i:
DReaM-de-restricted
36 965 999
tyska
Ordstatistik:
stats_DREAM-DE-RESTRICTED.txt.zip
2025-04-22 – 24.3 MB – CC BY 4.0
Utforska i:
DReaM-en-open
27 411 739
engelska
Ordstatistik:
stats_DREAM-EN-OPEN.txt.zip
2025-04-22 – 14.64 MB – CC BY 4.0
Utforska i:
DReaM-en-restricted
566 780 759
engelska
Ordstatistik:
stats_DREAM-EN-RESTRICTED.txt.zip
2025-04-22 – 182.85 MB – CC BY 4.0
Utforska i:
DReaM-es-open
9 115 151
spanska
Ordstatistik:
stats_DREAM-ES-OPEN.txt.zip
2025-04-22 – 9.23 MB – CC BY 4.0
Utforska i:
DReaM-es-restricted
37 883 869
spanska
Ordstatistik:
stats_DREAM-ES-RESTRICTED.txt.zip
2025-04-22 – 20.32 MB – CC BY 4.0
Utforska i:
Paginering
Sida
1
Sida
2
Sida
3
Sida
4
Sida
5
Sida
6
Sida
7
Sida
8
Sida
9
Sida
10
Sida
11
Sida
12
Sida
13
Nästa sida
Nästa ›
Sista sidan
Sista »
Aktuellt
Nyheter
Blogg
Kalender
Konferenser och workshopar
CLT retreat 2020
AI Trust workshop
CDLC workshop
CLT workshop Spring 2023
EACL 2014
Höstworkshop
Höstworkshop 2025
Höstworkshop 2024
Höstworkshop 2023
Höstworkshop 2022
Höstworkshop 2021
Höstworkshop 2020
Höstworkshop 2011 och Korp-släpp
Höstworkshop 2012
Höstworkshop 2013
Höstworkshop 2014
Höstworkshop 2015
Höstworkshop 2016
Höstworkshop 2017
Höstworkshop 2018
Höstworkshop 2019
Språkbanken 40 år
Korpworkshop
Korpworkshop 2014
Korpworkshop 2018
NoDaLiDa 2017
RESOURCEFUL
SLTC 2020
Programme
Instructions
People
Support
Call for papers
Sustainable language representations
Position statements
Workshop on Profiling second language vocabulary and grammar - 2023
Forskning
Publikationer
Doktorandutbildning
For PhD students and supervisors
Data
Analyser
Plattformar
Korp
Användarhandledning
Webb-API
Distribution och utveckling
Korpusstatistik
Nedladdningsbara meningsmängder
Karp
Webb-API
Sparv
Webb-Sparv - användarhandledning
Webb-API
Web Sparv - Technical Documentation
Mink
User manual
Övningsexempel
Video: överblick
Web API
Privacy and data policy
Strix
Lärka
Övriga verktyg
Catta
IT-baserad grammatikinlärning
Frågor och svar
Om oss
Personal
Organisation
Språkbanken Text i världen
Språkbanken 50 år
Jubileumsfirande
En kortfattad historik
Studera språkteknologi
Doktorandutbildning
Undervisning
Referera till oss
Alumner
Möten och workshoppar
Workshoppar
End of the year workshop & APT 2025
End of the year workshop 2024
End of the year workshop 2023
Semester workshop 2022
Semester workshop H2021
Semester workshop V2021
Semester workshop H2020
Semester workshop V2020
Forskningsmöten
Gruppmöten
SBX Retreat
SBX Retreat 2024
SBX Retreat 2023
SBX Retreat 2022
Kakor
Internt
Kontakt
Rådgivning