Hoppa till huvudinnehåll
Svenska
English
Språkbanken Text är en avdelning inom
Språkbanken
.
Aktuellt
Forskning
Verktyg
Data
Frågelåda
Om oss
Kontakt
Meny
Länkstig
Hem
Datamängder
Datamängder
Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden.
Alla (1282)
Samlingar (28)
Korpusar (1161)
Lexikon (61)
Tränings- och utvärderingsdata (15)
Modeller (45)
Namn eller beskrivning
Språk
- Alla -
svenska
albanska
blissymboler
bokmål
bosniska
bulgariska
danska
engelska
finlandssvenska
finska
fornengelska (ca 450-1100)
fornhögtyska (ca 750-1050)
fornisländska
fornsaxiska
franska
färöiska
högsorbiska
iranian persian
italienska
kele (papua new guinea)
kroatiska
kurdiska
latin
lågsorbiska
makedonska
modern greek (1453-)
nederländska
norska
polska
portugisiska
rumänska
ryska
serbiska
slavomolisano
slovakiska
slovenska
somali
spanska
tjeckiska
turkiska
turkmeniska
tyska
ukrainska
vitryska
Resurs
Typ
Språk
Åtkomst
Bloggmix 1999
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix1999.xml.bz2
2017-02-14 – 9.27 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX1999.txt
2017-02-19 – 2.75 MB – CC BY 4.0
Utforska i:
Bloggmix 2000
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2000.xml.bz2
2017-02-22 – 2.69 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2000.txt
2017-02-19 – 1.28 MB – CC BY 4.0
Utforska i:
Bloggmix 2001
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2001.xml.bz2
2017-02-14 – 4.7 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2001.txt
2017-02-19 – 2.05 MB – CC BY 4.0
Utforska i:
Bloggmix 2002
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2002.xml.bz2
2017-02-14 – 3.4 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2002.txt
2017-02-19 – 1.55 MB – CC BY 4.0
Utforska i:
Bloggmix 2003
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2003.xml.bz2
2017-02-14 – 3.76 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2003.txt
2017-02-19 – 1.83 MB – CC BY 4.0
Utforska i:
Bloggmix 2004
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2004.xml.bz2
2017-02-14 – 9.03 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2004.txt
2017-02-19 – 2.85 MB – CC BY 4.0
Utforska i:
Bloggmix 2005
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2005.xml.bz2
2017-02-14 – 70.01 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2005.txt
2017-02-19 – 11.01 MB – CC BY 4.0
Utforska i:
Bloggmix 2006
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2006.xml.bz2
2017-02-15 – 123.62 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2006.txt
2017-02-19 – 16.72 MB – CC BY 4.0
Utforska i:
Bloggmix 2007
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2007.xml.bz2
2017-02-15 – 288.92 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2007.txt
2017-02-19 – 27.5 MB – CC BY 4.0
Utforska i:
Bloggmix 2008
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2008.xml.bz2
2017-02-16 – 656.67 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2008.txt
2017-02-19 – 44.33 MB – CC BY 4.0
Utforska i:
Bloggmix 2009
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2009.xml.bz2
2017-02-17 – 1.1 GB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2009.txt
2017-02-19 – 60.62 MB – CC BY 4.0
Utforska i:
Bloggmix 2010
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2010.xml.bz2
2017-02-23 – 1.44 GB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2010.txt
2017-02-26 – 72.48 MB – CC BY 4.0
Utforska i:
Bloggmix 2011
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2011.xml.bz2
2017-02-24 – 1.48 GB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2011.txt
2017-02-26 – 71.79 MB – CC BY 4.0
Utforska i:
Bloggmix 2012
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2012.xml.bz2
2017-02-23 – 1.17 GB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2012.txt
2017-02-26 – 60.09 MB – CC BY 4.0
Utforska i:
Bloggmix 2013
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2013.xml.bz2
2017-02-24 – 930.12 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2013.txt
2017-02-26 – 50.29 MB – CC BY 4.0
Utforska i:
Bloggmix 2014
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2014.xml.bz2
2017-02-23 – 596.24 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2014.txt
2017-02-26 – 37.74 MB – CC BY 4.0
Utforska i:
Bloggmix 2015
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2015.xml.bz2
2017-05-10 – 434.91 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2015.txt
2017-05-10 – 30.57 MB – CC BY 4.0
Utforska i:
Bloggmix 2016
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2016.xml.bz2
2017-02-22 – 262.98 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2016.txt
2017-02-26 – 23.52 MB – CC BY 4.0
Utforska i:
Bloggmix 2017
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmix2017.xml.bz2
2017-02-22 – 23.48 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIX2017.txt
2017-02-26 – 5.84 MB – CC BY 4.0
Utforska i:
Bloggmix okänt datum
Material från ett urval av svenska bloggar. Uppdateras regelbundet.
Korpus
svenska
Datamängd:
bloggmixodat.xml.bz2
2017-02-23 – 511.42 MB – CC BY 4.0
Ordstatistik:
stats_BLOGGMIXODAT.txt
2017-02-26 – 36.51 MB – CC BY 4.0
Utforska i:
Bonniersromaner I (1976–77)
En korpus med 69 Bonniersromaner från 1976–77
Korpus
svenska
Datamängd:
romi.xml.bz2
2017-10-04 – 135.42 MB – CC BY 4.0
Ordstatistik:
stats_ROMI.txt
2017-10-08 – 12.78 MB – CC BY 4.0
Utforska i:
Bonniersromaner II (1980–81)
En korpus med 60 Bonniersromaner från 1980–81
Korpus
svenska
Datamängd:
romii.xml.bz2
2017-03-17 – 62.87 MB – CC BY 4.0
Ordstatistik:
stats_ROMII.txt
2017-03-19 – 11.09 MB – CC BY 4.0
Utforska i:
Bring
Brings "Svenskt ordförråd ordnat i begreppsklasser" (1930) i digital version
Lexikon
svenska
Datamängd:
bring.txt
2017-09-11 – 6.69 MB – CC BY 4.0
Caafimaad 1983
Korpus
somali
Datamängd:
somali-caafimaad-1983.xml.bz2
2024-01-15 – 4.48 KB – CC BY 4.0
Utforska i:
COCTAILL
Korpus av kursböcker för undervisning av L2-svenska. Annoterade manuellt för textstruktur och pedagogiska/didaktiska kategorier; automatiskt uppmärkt med språkvetenskapliga annoteringar.
Korpus
svenska
Datamängd:
coctaill.xml.bz2
2017-10-30 – 16.57 MB – CC BY 4.0
Ordstatistik:
stats_COCTAILL.txt
2017-11-05 – 3.03 MB – CC BY 4.0
Utforska i:
COCTAILL activities & examples
Korpus av kursböcker för undervisning av L2-svenska. Annoterade manuellt för textstruktur och pedagogiska/didaktiska kategorier; automatiskt uppmärkt med språkvetenskapliga annoteringar.
Korpus
svenska
Ordstatistik:
stats_COCTAILL-AE.txt
2021-07-04 – 1.71 MB – CC BY 4.0
Utforska i:
COCTAILL lesson text
Korpus av kursböcker för undervisning av L2-svenska. Annoterade manuellt för textstruktur och pedagogiska/didaktiska kategorier; automatiskt uppmärkt med språkvetenskapliga annoteringar.
Korpus
svenska
Ordstatistik:
stats_COCTAILL-LT.txt
2021-07-04 – 1.84 MB – CC BY 4.0
Utforska i:
CoDeRooMor, v.01
Dataset för morfologistudier (ordbildningsmorfologi), Svenska L2 profil-projektet
Lexikon
svenska
Datamängd:
CodeRoomor_v01_lemgramView.csv
2021-04-13 – 1.96 MB – CC BY 4.0
Datamängd:
CodeRoomor_v01_morphemeView.csv
2021-04-13 – 856.29 KB – CC BY 4.0
Datamängd:
CodeRoomor_v01_lemgramView.xlsx
2021-04-13 – 1.72 MB – CC BY 4.0
Datamängd:
CodeRoomor_v01_morphemeView.xlsx
2021-04-13 – 699.46 KB – CC BY 4.0
Utforska i:
Corpus of spoken isiXhosa
A corpus of transcribed and annotated recordings of spoken Xhosa.
Korpus
Utforska i:
Corpus Oral de Referencia del Español Contemporáneo
Korpus med transkriptioner från inspelade ljudband från 1991 till 1992. Del av SOL - Spanska Online
Korpus
spanska
Datamängd:
cor92.xml.bz2
2017-11-10 – 2.33 MB – CC BY 4.0
Utforska i:
Dagens Arena
Nyhetstexter från dagensarena.se
Korpus
svenska
Datamängd:
da.xml.bz2
2024-01-02 – 297.94 MB – CC BY 4.0
Ordstatistik:
stats_da.csv
2024-01-03 – 294.52 MB – CC BY 4.0
Utforska i:
DaLAJ-GED-Superlim 2.0
Dataset for Linguistic Acceptability Judgments (and more), v.2.0
Korpus
svenska
Datamängd:
dalaj-ged-superlim.zip
2023-04-03 – 1.41 MB – CC BY 4.0
Datamängd:
dalaj-ged-tsv.zip
2023-05-20 – 1.15 MB – CC BY 4.0
Datamängd:
liuep197-11.pdf
2024-01-25 – 463.74 KB – CC BY 4.0
Dalin Ordbok Öfver Svenska Språket
Dalins ordbok - Ordbok över 1800-talsspråket
Lexikon
svenska
Datamängd:
dalin.xml
2017-09-13 – 32.26 MB – CC BY 4.0
Utforska i:
Dalin Ordbok Öfver Svenska Språket - basmaterial
Dalins ordbok - Ordbok över 1800-talsspråket - basmaterial
Lexikon
svenska
Datamängd:
dalin-base.xml
2017-09-13 – 25.76 MB – CC BY 4.0
Utforska i:
Dalin: Then Swänska Argus 1732-1734
Manuell transkription av Then Swänska Argus av Olof von Dalin, Stockholm, 1732–1734. För OCR analys.
Korpus
svenska
Datamängd:
dalin-then-swaanska-argus-1732-1734.tar.gz
2020-06-12 – 80.21 MB – CC BY 4.0
Dalins morfologi
En morfologi från Dalins ordbok - Ordbok över 1800-talsspråket, som härleds ur Dalins basmaterial.
Lexikon
svenska
Datamängd:
dalinm.xml
2017-09-13 – 133.24 MB – CC BY 4.0
Utforska i:
Dalpilen 1860-talet
Del av samlingen Kubhist2
Korpus
svenska
Datamängd:
kubhist2-dalpilen-1860.xml.bz2
2024-01-09 – 273.1 MB – CC BY 4.0
Ordstatistik:
stats_kubhist2-dalpilen-1860.csv
2024-01-10 – 28 MB – CC BY 4.0
Utforska i:
Dependensparsningsmodell: Stanza
Förtränade modeller för dependensparsning.
Modell
svenska
Datamängd:
synt_stanza_eval.zip
2020-12-09 – 99.05 MB – CC BY 4.0
Datamängd:
synt_stanza_full2.zip
2020-12-09 – 99.17 MB – CC BY 4.0
Datamängd:
stanza_pretrain.zip
2020-12-09 – 105.77 MB – CC BY 4.0
Detektiva avdelningen
Data från Detektiva avdelningen vid Göteborgs poliskammare, från slutet av 1800-talet till början av 1900-talet.
Korpus
svenska
Datamängd:
geocoords.txt
2023-06-20 – 326.73 KB – CC BY 4.0
Datamängd:
pixelcoords.txt
2023-06-20 – 182.83 KB – CC BY 4.0
Detektiva avdelningen
Korpus
svenska
Datamängd:
detektivaavdelningen.xml.bz2
2024-03-13 – 20.95 MB – CC BY 4.0
Ordstatistik:
stats_detektivaavdelningen.csv
2024-03-28 – 2.47 MB – CC BY 4.0
Utforska i:
DiabetologNytt (1996–1999)
Tidningen DiabetologNytt 1996-1999
Korpus
svenska
Utforska i:
Diakronisk pivot
Diakronisk pivotresurs där historisk lexikal information länkas till SALDO
Lexikon
svenska
Datamängd:
diapivot.xml
2017-09-13 – 21.57 MB – CC BY 4.0
Utforska i:
Diverse tidningar
Fjorton årgångar av åtta olika tidsskrifter (1810–1933) som digitiserats av Projekt Runeberg
Korpus
svenska
Datamängd:
runeberg-diverse.xml.bz2
2014-12-08 – 65.51 MB – CC BY 4.0
Ordstatistik:
stats_RUNEBERG-DIVERSE.txt
2015-06-25 – 23.3 MB – CC BY 4.0
Utforska i:
DN 1987
Dagens Nyheter 1987
Korpus
svenska
Datamängd:
dn1987.xml.bz2
2022-12-13 – 137.38 MB – CC BY 4.0
Ordstatistik:
stats_dn1987.csv
2022-12-14 – 18.12 MB – CC BY 4.0
Utforska i:
Domar
Korpus
svenska
Datamängd:
moderntdv.xml.bz2
2015-05-20 – 295.47 MB – CC BY 4.0
Ordstatistik:
stats_MODERNTDV.txt
2017-07-09 – 21.03 MB – CC BY 4.0
Utforska i:
Dramawebben (demo)
Texter från Dramawebben, ett digitalt arkiv över fri svensk dramatik.
Korpus
svenska
Datamängd:
drama.xml.bz2
2017-03-21 – 9.1 MB – CC BY 4.0
Ordstatistik:
stats_DRAMA.txt
2017-03-26 – 2.61 MB – CC BY 4.0
Utforska i:
DReaM
En flerspråkig korpus av språkliga beskrivningar av världens naturliga språk.
Korpus
engelska
Datamängd:
dream.zip.bz2
2020-11-11 – 188.83 MB – CC BY 4.0
Utforska i:
DReaM-Copyright-Protected
En flerspråkig korpus av språkliga beskrivningar av världens naturliga språk.
Korpus
engelska
Ekeblads brev
Korpusen Ekeblads brev bygger på Sture Alléns digitala utgåva Breven till Claes 1639–1655.
Korpus
svenska
Datamängd:
ekeblad.xml.bz2
2015-05-18 – 246.95 KB – CC BY 4.0
Ordstatistik:
stats_EKEBLAD.txt
2015-06-25 – 149.72 KB – CC BY 4.0
Utforska i:
Engelska inbäddningar (word embeddings)
Förtränade inbäddningar (word embeddings) för engelska wikipedia
Modell
engelska
Datamängd:
wiki_300_5_word2vec.model
2024-01-25 – 112.01 MB – CC BY 4.0
Datamängd:
wiki_300_5_word2vec.model.syn1neg.npy
2024-01-25 – 3.75 GB – CC BY 4.0
Datamängd:
wiki_300_5_word2vec.model.wv.vectors.npy
2024-01-25 – 3.75 GB – CC BY 4.0
Datamängd:
wiki_300_50_word2vec.model
2024-01-25 – 28.04 MB – CC BY 4.0
Datamängd:
wiki_300_50_word2vec.model.syn1neg.npy
2024-01-25 – 949.26 MB – CC BY 4.0
Datamängd:
wiki_300_50_word2vec.model.wv.vectors.npy
2024-01-25 – 949.26 MB – CC BY 4.0
Etnologiska frågelistor
Nordiska museets etnologiska frågelistor
Korpus
svenska
Ordstatistik:
stats_fragelistor.csv
2022-11-16 – 96.69 MB – CC BY 4.0
Utforska i:
Eukalyptus skriven svenska
En trädbank som innnehåller skriven svenska, uppmärkt med ordklasser, syntax i stil med TIGER-trädbanken, flerordsenheter och ordbetydelser
Korpus
svenska
Datamängd:
Eukalyptus-1.0.0.zip
2024-01-25 – 4.58 MB – CC BY-SA 4.0
Datamängd:
Eukalyptus-0.1.0.zip
2024-01-25 – 3.66 MB – Mixed
Datamängd:
Eukalyptus-0.1.1.zip
2024-01-25 – 3.8 MB – Mixed
Datamängd:
Eukalyptus-0.2.0.zip
2024-01-25 – 4.19 MB – Mixed
Samling
Europarl
European Parliament Proceedings Parallel Corpus
Korpus
svenska, danska, tyska, modern greek (1453-), engelska, spanska, finska, franska, italienska, nederländska, portugisiska
Se 11 delresurser
Utforska i:
Europarl: svenska
Svenska delen av European Parliament Proceedings Parallel Corpus
Korpus
svenska
Datamängd:
europarl-sv.xml.bz2
2013-11-18 – 354.92 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-SV.txt
2014-04-29 – 18.2 MB – CC BY 4.0
Utforska i:
Europarl: svenska-danska
Del av European Parliament Proceedings Parallel Corpus
Korpus
svenska, danska
Datamängd:
europarl-sv.xml.bz2
2013-11-18 – 354.92 MB – CC BY 4.0
Datamängd:
europarl-da.xml.bz2
2013-11-19 – 77.48 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-SV.txt
2014-04-29 – 18.2 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-DA.txt
2014-04-29 – 7.58 MB – CC BY 4.0
Utforska i:
Europarl: svenska-engelska
Del av European Parliament Proceedings Parallel Corpus
Korpus
svenska, engelska
Datamängd:
europarl-sv.xml.bz2
2013-11-18 – 354.92 MB – CC BY 4.0
Datamängd:
europarl-en.xml.bz2
2013-11-19 – 75.48 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-SV.txt
2014-04-29 – 18.2 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-EN.txt
2013-11-17 – 2.41 MB – CC BY 4.0
Utforska i:
Europarl: svenska-finska
Del av European Parliament Proceedings Parallel Corpus
Korpus
svenska, finska
Datamängd:
europarl-sv.xml.bz2
2013-11-18 – 354.92 MB – CC BY 4.0
Datamängd:
europarl-fi.xml.bz2
2013-11-20 – 81.98 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-SV.txt
2014-04-29 – 18.2 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-FI.txt
2014-04-29 – 15.73 MB – CC BY 4.0
Utforska i:
Europarl: svenska-franska
Del av European Parliament Proceedings Parallel Corpus
Korpus
svenska, franska
Datamängd:
europarl-sv.xml.bz2
2013-11-18 – 354.92 MB – CC BY 4.0
Datamängd:
europarl-fr.xml.bz2
2013-11-20 – 91.83 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-SV.txt
2014-04-29 – 18.2 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-FR.txt
2013-11-17 – 2.64 MB – CC BY 4.0
Utforska i:
Europarl: svenska-grekiska
Del av European Parliament Proceedings Parallel Corpus
Korpus
svenska, modern greek (1453-)
Datamängd:
europarl-sv.xml.bz2
2013-11-18 – 354.92 MB – CC BY 4.0
Datamängd:
europarl-el.xml.bz2
2013-11-19 – 60.94 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-SV.txt
2014-04-29 – 18.2 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-EL.txt
2013-11-17 – 6.18 MB – CC BY 4.0
Utforska i:
Europarl: svenska-italienska
Del av European Parliament Proceedings Parallel Corpus
Korpus
svenska, italienska
Datamängd:
europarl-sv.xml.bz2
2013-11-18 – 354.92 MB – CC BY 4.0
Datamängd:
europarl-it.xml.bz2
2013-11-20 – 85.95 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-SV.txt
2014-04-29 – 18.2 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-IT.txt
2013-11-17 – 3.24 MB – CC BY 4.0
Utforska i:
Europarl: svenska-nederländska
Del av European Parliament Proceedings Parallel Corpus
Korpus
svenska, nederländska
Datamängd:
europarl-sv.xml.bz2
2013-11-18 – 354.92 MB – CC BY 4.0
Datamängd:
europarl-nl.xml.bz2
2013-11-20 – 90.24 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-SV.txt
2014-04-29 – 18.2 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-NL.txt
2013-11-17 – 5.75 MB – CC BY 4.0
Utforska i:
Europarl: svenska-portugisiska
Del av European Parliament Proceedings Parallel Corpus
Korpus
svenska, portugisiska
Datamängd:
europarl-sv.xml.bz2
2013-11-18 – 354.92 MB – CC BY 4.0
Datamängd:
europarl-pt.xml.bz2
2013-11-20 – 90.33 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-SV.txt
2014-04-29 – 18.2 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-PT.txt
2013-11-17 – 3.55 MB – CC BY 4.0
Utforska i:
Europarl: svenska-spanska
Del av European Parliament Proceedings Parallel Corpus
Korpus
svenska, spanska
Datamängd:
europarl-sv.xml.bz2
2013-11-18 – 354.92 MB – CC BY 4.0
Datamängd:
europarl-es.xml.bz2
2013-11-20 – 88.81 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-SV.txt
2014-04-29 – 18.2 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-ES.txt
2013-11-17 – 3.58 MB – CC BY 4.0
Utforska i:
Europarl: svenska-tyska
Del av European Parliament Proceedings Parallel Corpus
Korpus
svenska, tyska
Datamängd:
europarl-sv.xml.bz2
2013-11-18 – 354.92 MB – CC BY 4.0
Datamängd:
europarl-de.xml.bz2
2013-11-19 – 83.1 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-SV.txt
2014-04-29 – 18.2 MB – CC BY 4.0
Ordstatistik:
stats_EUROPARL-DE.txt
2014-04-29 – 8.14 MB – CC BY 4.0
Utforska i:
Fahlu Weckoblad 1810-talet
Del av samlingen Kubhist2
Korpus
svenska
Datamängd:
kubhist2-fahluweckoblad-1810.xml.bz2
2024-01-09 – 28.86 MB – CC BY 4.0
Ordstatistik:
stats_kubhist2-fahluweckoblad-1810.csv
2024-01-10 – 6.68 MB – CC BY 4.0
Utforska i:
Falköpings Tidning 1870-talet
Del av samlingen Kubhist2
Korpus
svenska
Datamängd:
kubhist2-falkopingstidning-1870.xml.bz2
2024-01-09 – 416.79 MB – CC BY 4.0
Ordstatistik:
stats_kubhist2-falkopingstidning-1870.csv
2024-01-10 – 44.54 MB – CC BY 4.0
Utforska i:
Faluposten 1870-talet
Del av samlingen Kubhist2
Korpus
svenska
Datamängd:
kubhist2-faluposten-1870.xml.bz2
2024-01-10 – 293.07 MB – CC BY 4.0
Ordstatistik:
stats_kubhist2-faluposten-1870.csv
2024-01-11 – 28.17 MB – CC BY 4.0
Utforska i:
Samling
Familjeliv
Material från diskussionsforumet Familjeliv
Korpus
svenska
Se 23 delresurser
Utforska i:
Familjeliv: Adoption
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-adoption.xml.bz2
2024-03-26 – 292.21 MB – CC BY 4.0
Ordstatistik:
stats_familjeliv-adoption.csv
2024-03-28 – 10.54 MB – CC BY 4.0
Utforska i:
Familjeliv: Allmänna rubriker – Ekonomi & juridik
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-allmanna-ekonomi.xml.bz2
2024-03-27 – 1.28 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-allmanna-ekonomi.csv
2024-03-28 – 39.7 MB – CC BY 4.0
Utforska i:
Familjeliv: Allmänna rubriker – Familjeliv.se
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-allmanna-familjeliv.xml.bz2
2024-03-27 – 1.7 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-allmanna-familjeliv.csv
2024-03-28 – 52.28 MB – CC BY 4.0
Utforska i:
Familjeliv: Allmänna rubriker – Fritid & hobby
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-allmanna-fritid.xml.bz2
2024-03-27 – 889.44 MB – CC BY 4.0
Ordstatistik:
stats_familjeliv-allmanna-fritid.csv
2024-03-28 – 38.11 MB – CC BY 4.0
Utforska i:
Familjeliv: Allmänna rubriker – Hus & hem
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-allmanna-hushem.xml.bz2
2024-04-01 – 1.97 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-allmanna-hushem.csv
2024-04-01 – 60.13 MB – CC BY 4.0
Utforska i:
Familjeliv: Allmänna rubriker – Husdjur
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-allmanna-husdjur.xml.bz2
2024-04-01 – 1.25 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-allmanna-husdjur.csv
2024-04-02 – 32.75 MB – CC BY 4.0
Utforska i:
Familjeliv: Allmänna rubriker – Kropp & själ
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-allmanna-kropp.xml.bz2
2024-04-01 – 3.6 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-allmanna-kropp.csv
2024-04-02 – 76.84 MB – CC BY 4.0
Utforska i:
Familjeliv: Allmänna rubriker – Nöje
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-allmanna-noje.xml.bz2
2024-04-02 – 2.36 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-allmanna-noje.csv
2024-04-02 – 75.58 MB – CC BY 4.0
Utforska i:
Familjeliv: Allmänna rubriker – Samhälle
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-allmanna-samhalle.xml.bz2
2024-04-04 – 7.85 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-allmanna-samhalle.csv
2024-04-04 – 145.28 MB – CC BY 4.0
Utforska i:
Familjeliv: Allmänna rubriker – Sandlådan
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-allmanna-sandladan.xml.bz2
2024-04-05 – 1.21 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-allmanna-sandladan.csv
2024-04-05 – 53.35 MB – CC BY 4.0
Utforska i:
Familjeliv: Änglarum
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-anglarum.xml.bz2
2024-04-12 – 510.06 MB – CC BY 4.0
Ordstatistik:
stats_familjeliv-anglarum.csv
2024-04-12 – 14.72 MB – CC BY 4.0
Utforska i:
Familjeliv: Förälder
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-foralder.xml.bz2
2024-04-09 – 15.43 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-foralder.csv
2024-04-09 – 177.75 MB – CC BY 4.0
Utforska i:
Familjeliv: Fråga experten
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-expert.xml.bz2
2024-03-27 – 208.43 MB – CC BY 4.0
Ordstatistik:
stats_familjeliv-expert.csv
2024-03-28 – 8 MB – CC BY 4.0
Utforska i:
Familjeliv: Gravid
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-gravid.xml.bz2
2024-04-02 – 11.56 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-gravid.csv
2024-04-02 – 119.09 MB – CC BY 4.0
Utforska i:
Familjeliv: Känsliga rummet
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-kansliga.xml.bz2
2024-04-16 – 25.46 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-kansliga.csv
2024-04-18 – 203.95 MB – CC BY 4.0
Utforska i:
Familjeliv: Medlemstrådar – Almänna
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-medlem-allmanna.xml.bz2
2024-04-08 – 6.65 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-medlem-allmanna.csv
2024-04-08 – 148.03 MB – CC BY 4.0
Utforska i:
Familjeliv: Medlemstrådar – Föräldrar
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-medlem-foraldrar.xml.bz2
2024-04-10 – 6.83 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-medlem-foraldrar.csv
2024-04-10 – 116.65 MB – CC BY 4.0
Utforska i:
Familjeliv: Medlemstrådar – Planerar barn
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-medlem-planerarbarn.xml.bz2
2024-04-11 – 2.87 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-medlem-planerarbarn.csv
2024-04-11 – 47.99 MB – CC BY 4.0
Utforska i:
Familjeliv: Medlemstrådar – Väntar barn
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-medlem-vantarbarn.xml.bz2
2024-04-11 – 6.77 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-medlem-vantarbarn.csv
2024-04-11 – 90.66 MB – CC BY 4.0
Utforska i:
Familjeliv: Pappagrupp
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-pappagrupp.xml.bz2
2024-03-26 – 60.26 MB – CC BY 4.0
Ordstatistik:
stats_familjeliv-pappagrupp.csv
2024-03-28 – 5.94 MB – CC BY 4.0
Utforska i:
Familjeliv: Planerar barn
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-planerarbarn.xml.bz2
2024-03-28 – 4.63 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-planerarbarn.csv
2024-03-30 – 55.17 MB – CC BY 4.0
Utforska i:
Familjeliv: Sex & samlevnad
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-sexsamlevnad.xml.bz2
2024-04-13 – 4.28 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-sexsamlevnad.csv
2024-04-13 – 62.07 MB – CC BY 4.0
Utforska i:
Familjeliv: Svårt att få barn
Material från diskussionsforumet Familjeliv.
Korpus
svenska
Datamängd:
familjeliv-svartattfabarn.xml.bz2
2024-04-15 – 4.05 GB – CC BY 4.0
Ordstatistik:
stats_familjeliv-svartattfabarn.csv
2024-04-15 – 53.63 MB – CC BY 4.0
Utforska i:
Samling
Finlandssvenska
Del av finlandssvensk språkbank över svenskan i Finland i dag och i går
Korpus
svenska
Se 56 delresurser
Utforska i:
Finlandssvenska: Åbo Underrättelser 2012
Regional svenskspråkig dagstidning i Åbotrakten
Korpus
svenska
Ordstatistik:
stats_ABOUNDERRATTELSER2012.txt
2017-06-18 – 5.66 MB – CC BY 4.0
Utforska i:
Finlandssvenska: Åbo Underrättelser 2013
Regional svenskspråkig dagstidning i Åbotrakten
Korpus
svenska
Ordstatistik:
stats_ABOUNDERRATTELSER2013.txt
2017-09-24 – 5.11 MB – CC BY 4.0
Utforska i:
Finlandssvenska: Ålandstidningen 2012
Regional svenskspråkig dagstidning på Åland
Korpus
svenska
Ordstatistik:
stats_AT2012.txt
2017-06-18 – 5.19 MB – CC BY 4.0
Utforska i:
Finlandssvenska: Astra 1960–1979
Tidskrift med kvinnoperspektiv
Korpus
svenska
Ordstatistik:
stats_ASTRA1960-1979.txt
2017-06-18 – 1.71 MB – CC BY 4.0
Utforska i:
Finlandssvenska: Astra Nova 2008–2010
Samtliga nummer av Astra Nova från perioden 2008–2010 med artiklar av finlandssvenska skribenter
Korpus
svenska
Ordstatistik:
stats_ASTRANOVA.txt
2017-06-18 – 1.78 MB – CC BY 4.0
Utforska i:
Finlandssvenska: Barnlitteratur 1988–2012
Material ur barnlitterära verk publicerade under 2000–2013
Korpus
finlandssvenska
Ordstatistik:
stats_BARNLITTERATUR.txt
2017-06-18 – 966.56 KB – CC BY 4.0
Utforska i:
Finlandssvenska: Bloggtexter 2006–2013
En samling med bloggtexter ur ett urval finlandssvenska bloggar
Korpus
svenska
Ordstatistik:
stats_FSBBLOGGVUXNA.txt
2017-06-18 – 4.71 MB – CC BY 4.0
Utforska i:
Finlandssvenska: Borgåbladet 2012–2013
Regional svenskspråkig dagstidning i Borgå med omnejd
Korpus
svenska
Ordstatistik:
stats_BORGABLADET.txt
2017-06-18 – 5.46 MB – CC BY 4.0
Utforska i:
Paginering
Första sidan
« Första
Föregående sida
‹ Föregående
Sida
1
Sida
2
Sida
3
Sida
4
Sida
5
Sida
6
Sida
7
Sida
8
Sida
9
Sida
10
Sida
11
Sida
12
Sida
13
Nästa sida
Nästa ›
Sista sidan
Sista »
Aktuellt
Nyheter
Konferenser och workshopar
CLT retreat 2020
AI Trust workshop
CDLC workshop
CLT workshop Spring 2023
EACL 2014
Höstworkshop
Höstworkshop 2024
Höstworkshop 2023
Höstworkshop 2022
Höstworkshop 2021
Höstworkshop 2020
Höstworkshop 2011 och Korp-släpp
Höstworkshop 2012
Höstworkshop 2013
Höstworkshop 2014
Höstworkshop 2015
Höstworkshop 2016
Höstworkshop 2017
Höstworkshop 2018
Höstworkshop 2019
Språkbanken 40 år
Korpworkshop
Korpworkshop 2014
Korpworkshop 2018
NoDaLiDa 2017
RESOURCEFUL
SLTC 2020
Programme
Instructions
People
Support
Call for papers
Sustainable language representations
Position statements
Workshop on Profiling second language vocabulary and grammar - 2023
Blogg
Kalender
Tidigare händelser
Forskning
Publikationer
Doktorandutbildning
For PhD students and supervisors
Verktyg
Korp
Användarhandledning
Webb-API
Distribution och utveckling
Korpusstatistik
Nedladdningsbara meningsmängder
Karp
Webb-API
Sparv
Sparvs korpuspipeline
Sparvs användarhandledning
Annotationer från Sparv
Webb-API
Web Sparv
Mink
User manual
Övningsexempel
Web API
Privacy and data policy
Lärka
Övriga verktyg
Catta
IT-baserad grammatikinlärning
Data
Frågelåda
Om oss
Personal
Organisation
Språkbanken Text i världen
Språkbanken 50 år
Jubileumsfirande
Doktorandutbildning
Undervisning
Referera till oss
Alumner
Möten och workshoppar
Workshoppar
End of the year workshop 2024
End of the year workshop 2023
Semester workshop 2022
Semester workshop H2021
Semester workshop V2021
Semester workshop H2020
Semester workshop V2020
Forskningsmöten
Gruppmöten
SBX Retreat
SBX Retreat 2024
SBX Retreat 2023
SBX Retreat 2022
Kakor
Internt
Kontakt
Rådgivning