Hoppa till huvudinnehåll
Svenska
English
Språkbanken Text är en avdelning inom
Språkbanken
.
Aktuellt
Forskning
Verktyg
Data
Frågelåda
Om oss
Kontakt
Meny
Länkstig
Hem
Datamängder
Datamängder
Datamängder
Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden.
Alla (1282)
Samlingar (28)
Korpusar (1161)
Lexikon (61)
Tränings- och utvärderingsdata (15)
Modeller (45)
Namn eller beskrivning
Språk
- Alla -
svenska
albanska
blissymboler
bokmål
bosniska
bulgariska
danska
engelska
finlandssvenska
finska
fornengelska (ca 450-1100)
fornhögtyska (ca 750-1050)
fornisländska
fornsaxiska
franska
färöiska
högsorbiska
iranian persian
italienska
kele (papua new guinea)
kroatiska
kurdiska
latin
lågsorbiska
makedonska
modern greek (1453-)
nederländska
norska
polska
portugisiska
rumänska
ryska
serbiska
slavomolisano
slovakiska
slovenska
somali
spanska
tjeckiska
turkiska
turkmeniska
tyska
ukrainska
vitryska
Resurs
Antal tokens
Språk
Åtkomst
Medeltidsbrev: Svenska
Brev på svenska, ur Svenskt Diplomatariums huvudkartotek (SDHK)
967 228
svenska
Datamängd:
sdhk-svenska.xml.bz2
2014-12-09 – 1.77 MB – CC BY 4.0
Ordstatistik:
stats_SDHK-SVENSKA.txt
2013-04-28 – 1.82 MB – CC BY 4.0
Utforska i:
Medeltidsbrev: Tyska
Brev på tyska, ur Svenskt Diplomatariums huvudkartotek (SDHK)
177 806
tyska
Datamängd:
sdhk-tyska.xml.bz2
2015-05-20 – 335.84 KB – CC BY 4.0
Ordstatistik:
stats_SDHK-TYSKA.txt
2013-04-28 – 396.26 KB – CC BY 4.0
Utforska i:
Nils Matsson Kiöpings resor
Reseskildringar från 1674 och 1743
76 209
svenska
Datamängd:
kioping.xml.bz2
2015-05-20 – 761.93 KB – CC BY 4.0
Ordstatistik:
stats_KIOPING.txt
2014-04-29 – 895.08 KB – CC BY 4.0
Utforska i:
Norstedtsromaner (1999)
En samling med 23 romaner utgivna 1999 på Norstedts förlag
2 533 209
svenska
Datamängd:
rom99.xml.bz2
2017-03-17 – 40.83 MB – CC BY 4.0
Ordstatistik:
stats_ROM99.txt
2017-03-19 – 7.38 MB – CC BY 4.0
Utforska i:
OpenEDGeS
En delmängd av korpusen EDGeS Diachronic Bible Corpus, som tillhandahålls under en publik licens. EDGeS är en diakron och synkron parallelkorpus med bibelöversättningar från 1300-talet till nutid.
19 399 149
svenska, engelska, tyska, nederländska
Datamängd:
OpenEDGeS_v1.01.zip
2024-01-25 – 121.17 MB – CC BY-NC-SA 4.0
Datamängd:
OpenEDGeS_v1.0.0.zip
2024-01-25 – 72.89 MB – For license details of the previous versions, see the 'Read me.txt' file in the download.
ORDAT
Svenska Dagbladets årsbok 1923–1958
1 528 935
svenska
Datamängd:
ordat.xml.bz2
2017-05-16 – 28.07 MB – CC BY 4.0
Ordstatistik:
stats_ORDAT.txt
2017-05-21 – 7.13 MB – CC BY 4.0
Utforska i:
Ordstatistik för korpusar
Ackumulerad ordstatistik från många av våra moderna svenska korpusar
Ordstatistik:
stats_all.txt
2022-04-10 – 5.14 GB – CC BY 4.0
PAROLE
En korpus annoterad med morfologisk och syntaktisk information
24 303 096
svenska
Datamängd:
parole.xml.bz2
2017-05-17 – 425.19 MB – CC BY 4.0
Datamängd:
parole.zip
2024-01-25 – 67.62 MB – CC BY 4.0
Ordstatistik:
stats_PAROLE.txt
2017-05-21 – 39.18 MB – CC BY 4.0
Utforska i:
Podiet
Artiklar från Konsertmagasinet Podiet
651 150
svenska
Datamängd:
podiet.xml.bz2
2024-01-02 – 14.4 MB – CC BY 4.0
Ordstatistik:
stats_podiet.csv
2024-01-03 – 11.99 MB – CC BY 4.0
Utforska i:
Poeter.se
Poesi från Poeter.se
106 196 502
svenska
Datamängd:
poeter.xml.bz2
2017-04-20 – 1.65 GB – CC BY 4.0
Ordstatistik:
stats_POETER.txt
2017-04-23 – 71.35 MB – CC BY 4.0
Utforska i:
Samling
Press
Svensk press
svenska
Se 6 delresurser
Utforska i:
Press 65
Svensk press 1965
1 119 449
svenska
Datamängd:
press65.xml.bz2
2017-03-14 – 20.88 MB – CC BY 4.0
Ordstatistik:
stats_PRESS65.txt
2017-03-19 – 6.71 MB – CC BY 4.0
Utforska i:
Press 76
Svensk press 1976
1 348 122
svenska
Datamängd:
press76.xml.bz2
2017-03-17 – 24.45 MB – CC BY 4.0
Ordstatistik:
stats_PRESS76.txt
2017-03-19 – 7.37 MB – CC BY 4.0
Utforska i:
Press 95
Svensk press 1995
7 671 700
svenska
Datamängd:
press95.xml.bz2
2017-03-15 – 139.65 MB – CC BY 4.0
Ordstatistik:
stats_PRESS95.txt
2017-03-19 – 19.6 MB – CC BY 4.0
Utforska i:
Press 96
Svensk press 1996
6 516 030
svenska
Datamängd:
press96.xml.bz2
2017-03-15 – 117.54 MB – CC BY 4.0
Ordstatistik:
stats_PRESS96.txt
2017-03-19 – 18.49 MB – CC BY 4.0
Utforska i:
Press 97
Svensk press 1997
13 703 279
svenska
Datamängd:
press97.xml.bz2
2017-03-17 – 241.09 MB – CC BY 4.0
Ordstatistik:
stats_PRESS97.txt
2017-03-19 – 28.62 MB – CC BY 4.0
Utforska i:
Press 98
Svensk press 1998
10 740 849
svenska
Datamängd:
press98.xml.bz2
2017-03-17 – 187.08 MB – CC BY 4.0
Ordstatistik:
stats_PRESS98.txt
2017-03-19 – 24.51 MB – CC BY 4.0
Utforska i:
Psalmboken (1937)
Psalmboken från 1937
163 574
svenska
Datamängd:
psalmboken.xml.bz2
2017-05-18 – 1.72 MB – CC BY 4.0
Ordstatistik:
stats_PSALMBOKEN.txt
2016-03-20 – 670.48 KB – CC BY 4.0
Utforska i:
Samling
Riksdagens öppna data
Data från data.riksdagen.se
svenska
Se 21 delresurser
Utforska i:
Riksdagens öppna data: Anföranden
Alla riksdagens anföranden från och med riksmötet 1993/94 till och med riksmötet 2017/2018
121 987 537
svenska
Datamängd:
rd-anf-1993-2018.xml.bz2
2020-03-30 – 2.22 GB – CC BY 4.0
Ordstatistik:
stats_RD-ANF-1993-2018.txt
2022-09-13 – 44.83 MB – CC BY 4.0
Riksdagens öppna data: Betänkande
Utskottens betänkanden och utlåtanden, inklusive rksdagens beslut, en sammanfattning av voteringsresultaten och Beslut i korthet
203 229 298
svenska
Datamängd:
rd-bet.xml.bz2
2022-10-11 – 3.84 GB – CC BY 4.0
Ordstatistik:
stats_rd-bet.csv
2022-10-11 – 290.32 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Departementsserien
Utredningar från regeringens departement
50 678 547
svenska
Datamängd:
rd-ds.xml.bz2
2022-09-06 – 928.31 MB – CC BY 4.0
Ordstatistik:
stats_rd-ds.csv
2022-09-06 – 48.44 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: EUN
Dokument från EU-nämnden, bland annat möteskallelser, föredragningslistor, protokoll och skriftliga samråd med regeringen
722 016
svenska
Datamängd:
rd-eun.xml.bz2
2023-02-03 – 8.72 MB – CC BY 4.0
Ordstatistik:
stats_rd-eun.csv
2023-02-04 – 1.01 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Faktapromemoria
Regeringens faktapromemorior om EU-kommissionens förslag
3 373 261
svenska
Datamängd:
rd-fpm.xml.bz2
2024-01-08 – 68.67 MB – CC BY 4.0
Ordstatistik:
stats_rd-fpm.csv
2023-01-26 – 7.05 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Föredragningslista
Föredragningslistor för kammarens sammanträden
842 042
svenska
Datamängd:
rd-flista.xml.bz2
2023-02-03 – 11.77 MB – CC BY 4.0
Ordstatistik:
stats_rd-flista.csv
2023-02-04 – 1.9 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Framställning/redogörelse
Framställningar och redogörelser från organ som utsetts av riksdagen
18 044 760
svenska
Datamängd:
rd-frsrdg.xml.bz2
2022-09-06 – 350.59 MB – CC BY 4.0
Ordstatistik:
stats_rd-frsrdg.csv
2022-09-06 – 20.91 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Interpellation
Interpellationer från ledamöterna till regeringen
25 969 006
svenska
Datamängd:
rd-ip.xml.bz2
2022-09-06 – 521.92 MB – CC BY 4.0
Ordstatistik:
stats_rd-ip.csv
2022-09-06 – 22.57 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Kammaraktiviteter
6 298 451
svenska
Datamängd:
rd-kammakt.xml.bz2
2023-02-06 – 129.07 MB – CC BY 4.0
Ordstatistik:
stats_rd-kammakt.csv
2023-02-07 – 9.48 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: KOM
EU-kommissionens förslag och redogörelser, så kallade KOM-dokument
44 678 107
svenska
Datamängd:
rd-kom.xml.bz2
2024-01-08 – 621 MB – CC BY 4.0
Ordstatistik:
stats_rd-kom.csv
2024-01-09 – 36.35 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Motion
Motioner från riksdagens ledamöter
162 923 798
svenska
Datamängd:
rd-mot.xml.bz2
2022-10-11 – 3.4 GB – CC BY 4.0
Ordstatistik:
stats_rd-mot.csv
2022-10-11 – 162.55 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Övrigt
Dokumentserierna Riksrevisionens granskningsrapporter, Utredningar från Riksdagsförvaltningen och Rapporter från riksdagen samt planeringsdokument, bilagor till dokument och uttag ur riksdagens databaser och de gamla dokumentserierna Utredningar från riksdag
21 916 385
svenska
Datamängd:
rd-ovr.xml.bz2
2022-09-08 – 417.6 MB – CC BY 4.0
Ordstatistik:
stats_rd-ovr.csv
2022-09-08 – 29.38 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Proposition
Propositioner och skrivelser från regeringen
379 103 550
svenska
Datamängd:
rd-prop.xml.bz2
2022-10-12 – 6.98 GB – CC BY 4.0
Ordstatistik:
stats_rd-prop.csv
2022-10-12 – 432.47 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Protokoll
Protokoll från kammarens sammanträden
247 384 265
svenska
Datamängd:
rd-prot.xml.bz2
2024-01-11 – 4.69 GB – CC BY 4.0
Ordstatistik:
stats_rd-prot.csv
2024-01-12 – 330.37 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Riksdagsskrivelse
Skrivelser från riksdagen till regeringen
236 335
svenska
Datamängd:
rd-rskr.xml.bz2
2022-09-09 – 2.55 MB – CC BY 4.0
Ordstatistik:
stats_rd-rskr.csv
2022-09-09 – 633.65 KB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Sammanträden
87 453
svenska
Datamängd:
rd-samtr.xml.bz2
2022-09-09 – 1.61 MB – CC BY 4.0
Ordstatistik:
stats_rd-samtr.csv
2022-09-09 – 603.69 KB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Skriftliga frågor
Skriftliga frågor från ledamöterna till regeringen och svaren på dessa
14 599 076
svenska
Datamängd:
rd-skfr.xml.bz2
2022-09-09 – 320.97 MB – CC BY 4.0
Ordstatistik:
stats_rd-skfr.csv
2022-09-09 – 17.85 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Statens offentliga utredningar
Olika utredningars förslag till regeringen
273 083 646
svenska
Datamängd:
rd-sou.xml.bz2
2024-01-11 – 5.09 GB – CC BY 4.0
Ordstatistik:
stats_rd-sou.csv
2024-01-12 – 164.59 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Talarlista
Talarlistor för kammarens sammanträden
320 875
svenska
Datamängd:
rd-tlista.xml.bz2
2022-09-09 – 3.63 MB – CC BY 4.0
Ordstatistik:
stats_rd-tlista.csv
2022-09-09 – 842.28 KB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Utredningar
Kommittédirektiv och kommittéberättelser för utredningar som regeringen tillsätter
1 548 660
svenska
Datamängd:
rd-utr.xml.bz2
2022-09-09 – 25.19 MB – CC BY 4.0
Ordstatistik:
stats_rd-utr.csv
2022-09-09 – 4.72 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Utskottsdokument
Dokument från utskotten, bland annat KU-anmälningar, protokoll, verksamhetsberättelser och den gamla dokumentserien Utredningar från riksdagen
65 746
svenska
Datamängd:
segreg-rd-utsk.xml.bz2
2024-11-18 – 1.08 MB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-utsk.csv
CC BY 4.0
Utforska i:
Riksdagens öppna data: Utskottsdokument
Dokument från utskotten, bland annat KU-anmälningar, protokoll, verksamhetsberättelser och den gamla dokumentserien Utredningar från riksdagen
5 865 972
svenska
Datamängd:
rd-utsk.xml.bz2
2022-09-09 – 80.14 MB – CC BY 4.0
Ordstatistik:
stats_rd-utsk.csv
2022-09-09 – 5.93 MB – CC BY 4.0
Utforska i:
Riksdagens öppna data: Yttrande
Utskottens yttranden
669 769
svenska
Datamängd:
segreg-rd-yttr.xml.bz2
2024-11-18 – 13.04 MB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-yttr.csv
CC BY 4.0
Utforska i:
Riksdagens öppna data: Yttrande
Utskottens yttranden
9 511 225
svenska
Datamängd:
rd-yttr.xml.bz2
2024-01-10 – 190.75 MB – CC BY 4.0
Ordstatistik:
stats_rd-yttr.csv
2024-01-11 – 20.03 MB – CC BY 4.0
Utforska i:
Rösträtt för kvinnor
Årgångarna 1912–1918 av tidskriften Rösträtt för kvinnor
1 873 503
svenska
Datamängd:
runeberg-rost.xml.bz2
2014-12-08 – 23.62 MB – CC BY 4.0
Ordstatistik:
stats_RUNEBERG-ROST.txt
2015-06-25 – 7.8 MB – CC BY 4.0
Utforska i:
SALT – svenska-nederländska
Nederländsk-svensk parallellkorpus av 1900-talet skön- och facklitterära texter.
2 845 857
svenska, nederländska
Datamängd:
saltnld-sv.xml.bz2
2016-05-03 – 18.23 MB – CC BY 4.0
Datamängd:
saltnld-nl.xml.bz2
2016-05-03 – 9.81 MB – CC BY 4.0
Ordstatistik:
stats_SALTNLD-SV.txt
2016-05-08 – 5.42 MB – CC BY 4.0
Ordstatistik:
stats_SALTNLD-NL.txt
2016-05-08 – 2.79 MB – CC BY 4.0
Utforska i:
SAOB1950
Skannade böcker från 1950 till 2007 som används som källmaterial för att uppdatera SAOB, med ett urval som speglar det svenska ordförrådet under 1900-talet.
50 285 466
svenska
Datamängd:
saob-bocker.xml.bz2
2023-11-30 – 1006.14 MB – CC BY 4.0
Ordstatistik:
stats_saob-bocker.csv
2023-12-01 – 367.54 MB – CC BY 4.0
Utforska i:
ScandiSent
Sentimentkorpus för svenska, norska, danska, finska och engelska, insamlad från trustpilot.
svenska, bokmål, danska, engelska, finska
Datamängd:
ScandiSent.zip
2024-01-25 – 5.16 MB – CC BY 4.0
Datamängd:
ScandiSent-mt.zip
2024-01-25 – 3.62 MB – CC BY 4.0
Segregations språk: Riksdagens öppna data: Betänkande
Utskottens betänkanden och utlåtanden, inklusive riksdagens beslut, en sammanfattning av voteringsresultaten och Beslut i korthet
26 706 890
svenska
Datamängd:
segreg-rd-bet.xml.bz2
2024-11-18 – 496.58 MB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-bet.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: Departementsserien
Utredningar från regeringens departement
6 820 996
svenska
Datamängd:
segreg-rd-ds.xml.bz2
2024-11-18 – 112.8 MB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-ds.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: EUN
Dokument från EU-nämnden, bland annat möteskallelser, föredragningslistor, protokoll och skriftliga samråd med regeringen
3 703
svenska
Datamängd:
segreg-rd-eun.xml.bz2
2024-11-18 – 55.98 KB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-eun.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: Faktapromemoria
Regeringens faktapromemorior om EU-kommissionens förslag
18 678
svenska
Datamängd:
segreg-rd-fpm.xml.bz2
2024-11-18 – 383.69 KB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-fpm.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: Föredragningslista
Föredragningslistor för kammarens sammanträden
5 149
svenska
Datamängd:
segreg-rd-flista.xml.bz2
2024-11-18 – 68.35 KB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-flista.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: Framställning/redogörelse
Framställningar och redogörelser från organ som utsetts av riksdagen
1 316 348
svenska
Datamängd:
segreg-rd-frsrdg.xml.bz2
2024-11-18 – 23.93 MB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-frsrdg.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: Interpellation
Interpellationer från ledamöterna till regeringen
948 204
svenska
Datamängd:
segreg-rd-ip.xml.bz2
2024-11-18 – 18.59 MB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-ip.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: Kammaraktiviteter
Texts that treat segregation
1 953 686
svenska
Datamängd:
segreg-rd-kammakt.xml.bz2
2024-11-18 – 39.34 MB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-kammakt.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: KOM
EU-kommissionens förslag och redogörelser, så kallade KOM-dokument
1 962 097
svenska
Datamängd:
segreg-rd-kom.xml.bz2
2024-11-18 – 13.21 MB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-kom.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: Motion
Motioner från riksdagens ledamöter
16 208 509
svenska
Datamängd:
segreg-rd-mot.xml.bz2
2024-11-18 – 338.26 MB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-mot.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: Övrigt
Dokumentserierna Riksrevisionens granskningsrapporter, Utredningar från Riksdagsförvaltningen och Rapporter från riksdagen samt planeringsdokument, bilagor till dokument och uttag ur riksdagens databaser och de gamla dokumentserierna Utredningar från riksdag
1 854 388
svenska
Datamängd:
segreg-rd-ovr.xml.bz2
2024-11-18 – 30.76 MB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-ovr.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: Proposition
Propositioner och skrivelser från regeringen
35 480 771
svenska
Datamängd:
segreg-rd-prop.xml.bz2
2024-11-18 – 629.25 MB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-prop.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: Protokoll
Protokoll från kammarens sammanträden
57 270 162
svenska
Datamängd:
segreg-rd-prot.xml.bz2
2024-11-18 – 1.06 GB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-prot.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: Skriftliga frågor
Skriftliga frågor från ledamöterna till regeringen och svaren på dessa
139 993
svenska
Datamängd:
segreg-rd-skfr.xml.bz2
2024-11-18 – 2.83 MB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-skfr.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: Statens offentliga utredningar
Olika utredningars förslag till regeringen
66 695 400
svenska
Datamängd:
segreg-rd-sou.xml.bz2
2024-11-18 – 1.23 GB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-sou.csv
CC BY 4.0
Utforska i:
Segregations språk: Riksdagens öppna data: Utredningar
Kommittédirektiv och kommittéberättelser för utredningar som regeringen tillsätter
4 121
svenska
Datamängd:
segreg-rd-utr.xml.bz2
2024-11-18 – 77.88 KB – CC BY 4.0
Ordstatistik:
stats_segreg-rd-utr.csv
CC BY 4.0
Utforska i:
SemEval2020 Task 1
Svensk testdata för SemEval 2020 Task 1: Unsupervised Lexical Semantic Change Detection (utdrag ur Kubhist v2)
182 000 000
svenska
Datamängd:
semeval2020_ulscd_swe.zip
2024-01-25 – 956.05 MB – CC BY 4.0
Sibirientyska
Sibirientyska är nedtecknad talad tyska som talas idag av c:a 36 000 människor i regionen Krasnojarsk i Sibirien (Ryssland).
34 205
svenska
Ordstatistik:
stats_SIBERIANGERMANDIALOGS.txt
2013-02-23 – 101.72 KB – CC BY 4.0
Utforska i:
Sibirientyska kvinnor
Samtal med fyra kvinnor födda mellan 1927 och 1937 i sovjetiska Volgarepubliken
16 208
svenska
Ordstatistik:
stats_SIBERIANGERMANWOMEN.txt
2017-03-19 – 44.62 KB – CC BY 4.0
Utforska i:
SIC2 - Stockholm Internet Corpus
Korpusen Stockholm Internet Corpus (SIC2) innehåller svenska bloggar som är annoterade med ordklasstaggar, morfologiska särdrag och namnentiteter.
13 562
svenska
Datamängd:
sic2.xml.bz2
2020-11-25 – 262.36 KB – CC BY 4.0
Ordstatistik:
stats_sic2.csv
2021-08-12 – 177.44 KB – CC BY 4.0
Datamängd:
sic2.zip
CC BY 4.0
Datamängd:
readme.txt
2020-11-17 – 2.18 KB – CC BY 4.0
Utforska i:
Smittskydd
Smittskyddsinstitutets tidskrift Smittskydd, årgångarna 2002–2010
691 716
svenska
Datamängd:
smittskydd.xml.bz2
2017-04-05 – 11.26 MB – CC BY 4.0
Ordstatistik:
stats_SMITTSKYDD.txt
2017-04-09 – 3 MB – CC BY 4.0
Utforska i:
SNP 1978–79
Riksdagens snabbprotokoll 1978–1979
4 865 138
svenska
Datamängd:
snp7879.xml.bz2
2017-04-05 – 81.35 MB – CC BY 4.0
Ordstatistik:
stats_SNP7879.txt
2017-04-09 – 7.13 MB – CC BY 4.0
Utforska i:
Samling
Somaliska korpusar
En samling av korpusar på somaliska
somali
Se 26 delresurser
Utforska i:
Somaliska Wikipedia
Korpus av somaliska Wikipedia
869 335
somali
Datamängd:
wikipedia-so.xml.bz2
2016-10-27 – 2.34 MB – CC BY 4.0
Ordstatistik:
stats_WIKIPEDIA-SO.txt
2020-02-25 – 1.9 MB – CC BY 4.0
Utforska i:
Somaliska: Af Soomaali 1971-79
50 794
somali
Datamängd:
somali-1971-79.xml.bz2
2023-02-17 – 135.14 KB – CC BY 4.0
Utforska i:
Somaliska: Af-Soomaali 2001 Somaliland
35 043
somali
Datamängd:
somali-as-2001.xml.bz2
2021-08-27 – 113.01 KB – CC BY 4.0
Utforska i:
Somaliska: Af-Soomaali 2001 Soomaaliya
129 947
somali
Datamängd:
somali-2001.xml.bz2
2023-02-17 – 288.17 KB – CC BY 4.0
Utforska i:
Somaliska: Af-Soomaali 2006 Itoobiya
64 351
somali
Datamängd:
somali-itoobiya.xml.bz2
2017-06-28 – 125.93 KB – CC BY 4.0
Utforska i:
Somaliska: Af-Soomaali 2010 Somaliland
51 513
somali
Datamängd:
somali-hargeysa-2010.xml.bz2
2017-11-27 – 145.67 KB – CC BY 4.0
Utforska i:
Somaliska: Af-Soomaali 2013 Somaliland
25 247
somali
Datamängd:
somali-as-2013.xml.bz2
2019-02-18 – 59.78 KB – CC BY 4.0
Utforska i:
Somaliska: Af-Soomaali 2018 Soomaaliya
15 677
somali
Datamängd:
somali-as-2018.xml.bz2
2019-10-01 – 32.81 KB – CC BY 4.0
Utforska i:
Somaliska: Afka Hooyo 1992-02 Kanada
706
somali
Datamängd:
somali-ah-1992-02-kanada.xml.bz2
2017-01-30 – 2.99 KB – CC BY 4.0
Utforska i:
Somaliska: Afka Hooyo 2010–19 Iswiidhan
21 542
somali
Datamängd:
somali-ah-2010-19.xml.bz2
2021-08-30 – 65.49 KB – CC BY 4.0
Utforska i:
Somaliska: BBC
82 437
somali
Datamängd:
somali-bbc.xml.bz2
2017-05-31 – 181.65 KB – CC BY 4.0
Utforska i:
Somaliska: Caafimaad 1972–79
13 550
somali
Datamängd:
somali-caafimaad-1972-79.xml.bz2
2021-08-30 – 38.92 KB – CC BY 4.0
Utforska i:
Somaliska: Caafimaad 1994
8 977
somali
Datamängd:
somali-caafimaad-1994.xml.bz2
2017-05-16 – 24.79 KB – CC BY 4.0
Utforska i:
Somaliska: Cilmi-Afeed
190 429
somali
Datamängd:
somali-cilmi.xml.bz2
2021-08-27 – 683.26 KB – CC BY 4.0
Utforska i:
Somaliska: Cilmiga Bulshada 1971–1980
79 005
somali
Datamängd:
somali-cb.xml.bz2
2018-03-12 – 212.86 KB – CC BY 4.0
Ordstatistik:
stats_SOMALI-CB.txt
2020-02-25 – 265.81 KB – CC BY 4.0
Utforska i:
Somaliska: Cilmiga Bulshada 1980-89
4 951
somali
Datamängd:
somali-cb-1980-89.xml.bz2
2018-03-12 – 13.05 KB – CC BY 4.0
Utforska i:
Somaliska: Cilmiga Bulshada 2001 Somaliland
30 258
somali
Datamängd:
somali-hargeysa.xml.bz2
2017-09-20 – 72.85 KB – CC BY 4.0
Utforska i:
Somaliska: Cilmiga Bulshada 2001-03 Soomaaliya
48 234
somali
Datamängd:
somali-cb-2001-03-soomaaliya.xml.bz2
2021-08-27 – 159.48 KB – CC BY 4.0
Utforska i:
Somaliska: Cilmiga Bulshada 2010 Somaliland
11 713
somali
Datamängd:
somali-cb-2010.xml.bz2
2019-02-18 – 27.54 KB – CC BY 4.0
Utforska i:
Somaliska: Cilmiga Bulshada 2011 Itoobiya
30 124
somali
Datamängd:
somali-cb-2011.xml.bz2
2019-02-18 – 64 KB – CC BY 4.0
Utforska i:
Somaliska: Cilmiga Bulshada 2016 Somaliland
54 498
somali
Datamängd:
somali-cb-2016.xml.bz2
2021-08-27 – 179.66 KB – CC BY 4.0
Utforska i:
Somaliska: Cilmiga Bulshada 2018 Soomaaliya
42 557
somali
Datamängd:
somali-cb-2018.xml.bz2
2019-10-01 – 77.07 KB – CC BY 4.0
Utforska i:
Somaliska: Cilmiga Deegaanka 2012 Itoobiya
56 874
somali
Datamängd:
somali-cd-2012-itoobiya.xml.bz2
2018-03-12 – 132.13 KB – CC BY 4.0
Utforska i:
Somaliska: Golaha Wakiillada Somaliland
539 206
somali
Datamängd:
somali-wakiillada.xml.bz2
2017-05-31 – 1.17 MB – CC BY 4.0
Utforska i:
Somaliska: Haatuf News 2002
1 495 343
somali
Datamängd:
somali-haatuf-news-2002.xml.bz2
2018-06-27 – 3.34 MB – CC BY 4.0
Utforska i:
Somaliska: Haatuf News 2003
2 359 710
somali
Datamängd:
somali-haatuf-news-2003.xml.bz2
2018-06-27 – 5.29 MB – CC BY 4.0
Utforska i:
Somaliska: Haatuf News 2004
1 813 484
somali
Datamängd:
somali-haatuf-news-2004.xml.bz2
2018-06-27 – 4.08 MB – CC BY 4.0
Utforska i:
Somaliska: Haatuf News 2005
2 003 060
somali
Datamängd:
somali-haatuf-news-2005.xml.bz2
2018-06-27 – 4.57 MB – CC BY 4.0
Utforska i:
Somaliska: Haatuf News 2006
2 125 632
somali
Datamängd:
somali-haatuf-news-2006.xml.bz2
2018-06-27 – 4.69 MB – CC BY 4.0
Utforska i:
Somaliska: Haatuf News 2007
1 758 810
somali
Datamängd:
somali-haatuf-news-2007.xml.bz2
2018-06-27 – 3.93 MB – CC BY 4.0
Utforska i:
Paginering
Första sidan
« Första
Föregående sida
‹ Föregående
Sida
1
Sida
2
Sida
3
Sida
4
Sida
5
Sida
6
Sida
7
Sida
8
Sida
9
Sida
10
Sida
11
Sida
12
Nästa sida
Nästa ›
Sista sidan
Sista »
Aktuellt
Nyheter
Konferenser och workshopar
CLT retreat 2020
AI Trust workshop
CDLC workshop
CLT workshop Spring 2023
EACL 2014
Höstworkshop
Höstworkshop 2024
Höstworkshop 2023
Höstworkshop 2022
Höstworkshop 2021
Höstworkshop 2020
Höstworkshop 2011 och Korp-släpp
Höstworkshop 2012
Höstworkshop 2013
Höstworkshop 2014
Höstworkshop 2015
Höstworkshop 2016
Höstworkshop 2017
Höstworkshop 2018
Höstworkshop 2019
Språkbanken 40 år
Korpworkshop
Korpworkshop 2014
Korpworkshop 2018
NoDaLiDa 2017
RESOURCEFUL
SLTC 2020
Programme
Instructions
People
Support
Call for papers
Sustainable language representations
Position statements
Workshop on Profiling second language vocabulary and grammar - 2023
Blogg
Kalender
Tidigare händelser
Forskning
Publikationer
Doktorandutbildning
For PhD students and supervisors
Verktyg
Korp
Användarhandledning
Webb-API
Distribution och utveckling
Korpusstatistik
Nedladdningsbara meningsmängder
Karp
Webb-API
Sparv
Sparvs korpuspipeline
Sparvs användarhandledning
Annotationer från Sparv
Webb-API
Web Sparv
Mink
User manual
Övningsexempel
Web API
Privacy and data policy
Lärka
Övriga verktyg
Catta
IT-baserad grammatikinlärning
Data
Frågelåda
Om oss
Personal
Organisation
Språkbanken Text i världen
Språkbanken 50 år
Jubileumsfirande
Doktorandutbildning
Undervisning
Referera till oss
Alumner
Möten och workshoppar
Workshoppar
End of the year workshop 2024
End of the year workshop 2023
Semester workshop 2022
Semester workshop H2021
Semester workshop V2021
Semester workshop H2020
Semester workshop V2020
Forskningsmöten
Gruppmöten
SBX Retreat
SBX Retreat 2024
SBX Retreat 2023
SBX Retreat 2022
Kakor
Internt
Kontakt
Rådgivning