Hoppa till huvudinnehåll
Svenska
English
Språkbanken Text är en avdelning inom
Språkbanken
.
Aktuellt
Forskning
Verktyg
Data
Frågelåda
Om oss
Kontakt
Meny
Länkstig
Hem
Datamängder
Datamängder
Datamängder
Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden.
Alla (1282)
Samlingar (28)
Korpusar (1161)
Lexikon (61)
Tränings- och utvärderingsdata (15)
Modeller (45)
Namn eller beskrivning
Språk
- Alla -
svenska
albanska
blissymboler
bokmål
bosniska
bulgariska
danska
engelska
finlandssvenska
finska
fornengelska (ca 450-1100)
fornhögtyska (ca 750-1050)
fornisländska
fornsaxiska
franska
färöiska
högsorbiska
iranian persian
italienska
kele (papua new guinea)
kroatiska
kurdiska
latin
lågsorbiska
makedonska
modern greek (1453-)
nederländska
norska
polska
portugisiska
rumänska
ryska
serbiska
slavomolisano
slovakiska
slovenska
somali
spanska
tjeckiska
turkiska
turkmeniska
tyska
ukrainska
vitryska
Resurs
Antal ingångar
Språk
Åtkomst
Akademisk ordlista
Akademisk ordlista
655
svenska
Datamängd:
ao.xml
2017-09-13 – 265.72 KB – CC BY 4.0
Utforska i:
Aventinus
Narkotikarelaterad terminologi
13 803
svenska
Datamängd:
aventinus.zip
2023-06-12 – 339.93 KB – CC BY 4.0
Blingbring
Blingbring, en SALDO-länkad och moderniserad version av Brings "Svenskt ordförråd ordnat i begreppsklasser" (1930)
126 910
svenska
Datamängd:
blingbring.txt
2017-09-20 – 7.52 MB – CC BY 4.0
Datamängd:
blingbring.xml
2021-11-09 – 42.68 MB – CC BY 4.0
Utforska i:
Bliss
Bliss är ett konstruerat symbolspråk som främst används av personer med grava kommunikativa och fysiska funktionsnedsättningar. Det består av ca 5000 grafiska symboler.
5 596
blissymboler
Datamängd:
bliss.xml
2017-09-13 – 2.73 MB – CC BY 4.0
Bring
Brings "Svenskt ordförråd ordnat i begreppsklasser" (1930) i digital version
148 815
svenska
Datamängd:
bring.txt
2017-09-11 – 6.69 MB – CC BY 4.0
CoDeRooMor, v.01
Dataset för morfologistudier (ordbildningsmorfologi), Svenska L2 profil-projektet
svenska
Datamängd:
CodeRoomor_v01_lemgramView.csv
2021-04-13 – 1.96 MB – CC BY 4.0
Datamängd:
CodeRoomor_v01_morphemeView.csv
2021-04-13 – 856.29 KB – CC BY 4.0
Datamängd:
CodeRoomor_v01_lemgramView.xlsx
2021-04-13 – 1.72 MB – CC BY 4.0
Datamängd:
CodeRoomor_v01_morphemeView.xlsx
2021-04-13 – 699.46 KB – CC BY 4.0
Utforska i:
Dalin Ordbok Öfver Svenska Språket
Dalins ordbok - Ordbok över 1800-talsspråket
62 975
svenska
Datamängd:
dalin.xml
2017-09-13 – 32.26 MB – CC BY 4.0
Utforska i:
Dalin Ordbok Öfver Svenska Språket - basmaterial
Dalins ordbok - Ordbok över 1800-talsspråket - basmaterial
62 327
svenska
Datamängd:
dalin-base.xml
2017-09-13 – 25.76 MB – CC BY 4.0
Utforska i:
Dalins morfologi
En morfologi från Dalins ordbok - Ordbok över 1800-talsspråket, som härleds ur Dalins basmaterial.
62 327
svenska
Datamängd:
dalinm.xml
2017-09-13 – 133.24 MB – CC BY 4.0
Utforska i:
Diakronisk pivot
Diakronisk pivotresurs där historisk lexikal information länkas till SALDO
29 432
svenska
Datamängd:
diapivot.xml
2017-09-13 – 21.57 MB – CC BY 4.0
Utforska i:
Flerspråkigt Konstruktikon
Ett flerspråkigt konstruktikon
740
svenska, ryska
Datamängd:
konstruktikon-multi.xml
2021-11-09 – 1.47 MB – CC BY 4.0
Fornsvensk morfologi
Fornsvensk morfologi ur Söderwall och Schlyter
41 958
svenska
Datamängd:
fsvm.xml
2017-09-13 – 31.61 MB – CC BY 4.0
Utforska i:
Hellquists Svensk etymologisk ordbok
Hellquists Svensk etymologisk ordbok
12 368
svenska
Datamängd:
hellqvist.xml
2021-11-09 – 20.88 MB – CC BY 4.0
Utforska i:
Idiom ur NEO-databasen
Idiom med beskrivningar och alternativformer extraherade ut databasen för Nationalencyklopediens ordbok
svenska
Datamängd:
idiom_ur_neodatabasen.xlsx
2015-03-24 – 429.97 KB – CC BY 4.0
Datamängd:
neo_idiom_m_alternativformer.xml
2015-03-24 – 2.55 MB – CC BY 4.0
Kelly
Nyckelord för språkinlärning för unga och vuxna
8 425
svenska
Datamängd:
kelly.xml
2017-09-15 – 5.56 MB – CC BY 4.0
Datamängd:
Swedish-Kelly_M3_CEFR.xls
2012-02-15 – 1.28 MB – CC BY 4.0
Utforska i:
Konstruktikon
Svenskt konstruktikon
441
svenska
Datamängd:
konstruktikon.xml
2021-11-09 – 2.03 MB – CC BY 4.0
Utforska i:
LingFN
Ett domänspecifikt frasnät med lingvistiska termer
173
svenska
Utforska i:
LingFN-thesis
Ett domänspecifikt frasnät med lingvistiska termer
16
svenska
LingFN-V2
Ett domänspecifikt frasnät med lingvistiska termer
169
svenska
Utforska i:
lsilex
Ett lexikon framtaget inom LSI-projektet
41
svenska
Utforska i:
LWT
Lånordstypologi
1 460
svenska, engelska
Datamängd:
lwt.xml
2017-09-19 – 665.94 KB – CC BY 4.0
Utforska i:
LWT-PWN
LWT-PWN är IDS/LWT-begreppslistan med länkar till ordbetydelseidentifierare i Princeton WordNet 3.0.
1 375
svenska
Datamängd:
lwt-pwn.txt
2015-03-31 – 204.14 KB – CC BY 4.0
MAÞiR Ord
Fornsvensk lexikal resurs baserad på Söderwalls ordbok, lämpligt för bl a konstruktion av lemmatiseringsmodeller.
28 357
svenska
Datamängd:
mathir_words_v1.0.tgz
2024-01-25 – 306.42 KB – CC BY 4.0
MoCCA
Model of Comparative Concepts for Aligning Constructicons
1 100
Datamängd:
cc-database.yaml
130.49 KB
Utforska i:
NordiCon
NordiCon är en databas som samlar medeltida nordgermanska personnamn från källor utanför Skandinavien.
engelska
Utforska i:
Samling
NPEGL
En databas över nominalfraser i äldre germanska språk.
fornengelska (ca 450-1100), fornhögtyska (ca 750-1050), fornisländska, fornsaxiska
Se 5 delresurser
Utforska i:
NyLLex v2
En lexikal resurs baserad på böcker utgivna av det svenska förlaget som publicerar flest lätt-att-läsa texter. Ingångar är annoterade med frekvenser fördelade över sex läsnivåer.
svenska
Datamängd:
nyllex_v2.csv
2023-06-09 – 1.46 MB – CC BY 4.0
OSA (SAOB)
Svenska Akademiens ordbok på nätet
svenska
Parole
Svenskt PAROLE lexikon - En språkteknologisk resurs med syntaktisk information
29 298
svenska
Datamängd:
PAROLE_usyn_descr.txt
2012-03-27 – 913.17 KB – CC BY 4.0
Parole+
Svenskt PAROLE lexikon - En språkteknologisk resurs med syntaktisk information, partiellt länkad till betydelser i SALDO
29 621
svenska
Datamängd:
parolelexplus.xml
2017-09-19 – 13.93 MB – CC BY 4.0
Utforska i:
Rysk Konstruktikon
Ett ryskt konstruktikon
715
ryska, engelska
Datamängd:
konstruktikon-rus.xml
2021-11-09 – 2.72 MB – CC BY 4.0
SALDO
SALDO är ett semantiskt och morfologiskt lexikon för modernt svenskt skriftspråk för språkteknologi.
131 020
svenska
Datamängd:
saldo.xml
2017-09-19 – 70.98 MB – CC BY 4.0
Utforska i:
SALDO: exempel
Exempelmeningar för SALDO-betydelser
3 334
svenska
Datamängd:
saldoe.xml
2017-09-19 – 1.09 MB – CC BY 4.0
Utforska i:
SALDOs morfologi
Semantiskt och morfologiskt lexikon för språkteknologi
128 036
svenska
Datamängd:
saldom.xml
2017-09-19 – 242.34 MB – CC BY 4.0
Utforska i:
Schlyter
Ordbok över svenska medeltidsspråket
10 067
svenska
Datamängd:
schlyter.xml
2017-09-19 – 6.87 MB – CC BY 4.0
Utforska i:
SenSALDO
SenSALDO, SALDO-ingångar och textord med attitydinformation
12 287
svenska
Datamängd:
sensaldo-v02.zip
2019-04-04 – 301.78 KB – CC BY 4.0
Datamängd:
sensaldo.zip
2018-03-05 – 235.62 KB – CC BY 4.0
Sentimentlexikon
Sentimentlexikon för svenska baserad på SALDO
2 067
svenska
Datamängd:
sentimentlex.xml
2017-09-19 – 1.78 MB – CC BY 4.0
Datamängd:
sentimentlex.csv
2016-07-11 – 486.9 KB – CC BY 4.0
Simple lexikon
Svenskt SIMPLE lexikon - En språkteknologisk resurs med semantisk information
11 624
svenska
Datamängd:
simple_n.html
2010-06-10 – 1.61 MB – CC BY 4.0
Datamängd:
simple_v.html
2010-06-10 – 559.34 KB – CC BY 4.0
Datamängd:
simple_adj.html
2010-06-10 – 104.41 KB – CC BY 4.0
Simple+
Svenskt SIMPLE lexikon - En språkteknologisk resurs med semantisk information, kopplade till betydelser i SALDO
8 630
svenska
Datamängd:
simpleplus.xml
2017-09-19 – 6.9 MB – CC BY 4.0
Datamängd:
simple_n.html
2010-06-10 – 1.61 MB – CC BY 4.0
Datamängd:
simple_v.html
2010-06-10 – 559.34 KB – CC BY 4.0
Datamängd:
simple_adj.html
2010-06-10 – 104.41 KB – CC BY 4.0
Utforska i:
SKBL
Svenskt kvinnobiografiskt lexikon
1 411
svenska, engelska
Datamängd:
skbl.json
2024-12-30 – 47.72 MB – CC BY 4.0
Utforska i:
Söderwall
Ordbok över svenska medeltidsspråket
22 572
svenska
Datamängd:
soederwall.xml
2017-09-19 – 23.42 MB – CC BY 4.0
Utforska i:
Söderwall Supplement
Ordbok över svenska medeltidsspråket
19 172
svenska
Datamängd:
soederwall-supp.xml
2017-09-19 – 15.45 MB – CC BY 4.0
Utforska i:
Sportanglicismer
Engelska lånord i svenska sportspalter
svenska
Utforska i:
Svensk-finska ordlistor
Svensk-finska ordlistor inom olika ämnesområden
9 607
svenska
Svenska ord, LEXIN
Lexikon för invandrare. Andra upplagan
29 111
svenska, albanska, bosniska, engelska, finska, modern greek (1453-), kroatiska, kurdiska, iranian persian, ryska, serbiska, somali, spanska, turkiska
Datamängd:
LEXIN.zip
2024-01-25 – 1.05 MB – CC BY 4.0
Utforska i:
Svenskt frasnät (SweFN)
En lexikal-semantisk resurs baserad på samma principer som engelska Berkeley FrameNet. Denna del av resursen innehåller de semantiska ramarna och det manuellt annoterade semantiska innehållet.
1 195
svenska
Datamängd:
swefn.xml
2021-11-09 – 7 MB – CC BY 4.0
Datamängd:
swefn-full.zip
2021-12-21 – 7.53 MB – CC BY 4.0
Utforska i:
Svenskt frasnät 2.0 (SweFN)
En lexikal-semantisk resurs baserad på samma principer som engelska Berkeley FrameNet. Denna version är uppdaterad för att motsvara BFN 1.7.
1 329
svenska
Datamängd:
swefn-2-0.json.zip
2024-10-16 – 1006.51 KB – CC BY 4.0
Datamängd:
swefn-2-0.tsv.zip
2024-10-16 – 969.61 KB – CC BY 4.0
Swedbergs Swensk ordabok
Swedbergs Swensk Ordabok
17 565
svenska, latin
Datamängd:
swedberg.xml
2017-09-19 – 8.89 MB – CC BY 4.0
Utforska i:
Swedbergs Swensk ordabok (morfologi, f.n. rudimentär)
Swedbergs Swensk Ordabok (morfologi, f.n. rudimentär)
17 565
svenska
Datamängd:
swedbergm.xml
2017-09-19 – 5.76 MB – CC BY 4.0
Utforska i:
SweSAT Högskoleprovet ordförståelse 1.1
Högskoleprovet ordförståelse
782
svenska
Datamängd:
swesat-synonyms.zip
2023-03-30 – 37.73 KB – CC BY 4.0
Swesaurus
Ett svenskt ordnät
15 010
svenska
Datamängd:
swesaurus.xml
2017-09-19 – 12.16 MB – CC BY 4.0
Utforska i:
The Swedish PoliGraph
En utvidgbar kunskapsgraf med information om Riksdagens ledamöter
505 989
svenska
Datamängd:
poligraph.tar.bz2
2020-01-14 – 2.29 MB – GNU GPLv3 or later
Utforska i:
UNSC-Graph
En utvidgbar kunskapsgraf för UNSC-korpusen med detaljer om deltagare och debatter från FN:s säkerhetsråd 1995-2020
1 017 406
engelska
Datamängd:
unsc-graph-1.0.tar.gz
2023-08-31 – 4.8 MB – GNU GPLv3 or later
WordNet-SALDO
En länkning mellan SALDO och Core WordNet
6 989
svenska, engelska
Datamängd:
wordnet-saldo.xml
2017-09-19 – 5.71 MB – CC BY 4.0
Utforska i:
Yrkesbeteckningar
En lista över yrkesbeteckningar på svenska
13 833
svenska
Datamängd:
vocationTerms150120.utf.txt.gz
2024-01-25 – 67.12 KB – CC BY 4.0
Aktuellt
Nyheter
Konferenser och workshopar
CLT retreat 2020
AI Trust workshop
CDLC workshop
CLT workshop Spring 2023
EACL 2014
Höstworkshop
Höstworkshop 2024
Höstworkshop 2023
Höstworkshop 2022
Höstworkshop 2021
Höstworkshop 2020
Höstworkshop 2011 och Korp-släpp
Höstworkshop 2012
Höstworkshop 2013
Höstworkshop 2014
Höstworkshop 2015
Höstworkshop 2016
Höstworkshop 2017
Höstworkshop 2018
Höstworkshop 2019
Språkbanken 40 år
Korpworkshop
Korpworkshop 2014
Korpworkshop 2018
NoDaLiDa 2017
RESOURCEFUL
SLTC 2020
Programme
Instructions
People
Support
Call for papers
Sustainable language representations
Position statements
Workshop on Profiling second language vocabulary and grammar - 2023
Blogg
Kalender
Tidigare händelser
Forskning
Publikationer
Doktorandutbildning
For PhD students and supervisors
Verktyg
Korp
Användarhandledning
Webb-API
Distribution och utveckling
Korpusstatistik
Nedladdningsbara meningsmängder
Karp
Webb-API
Sparv
Sparvs korpuspipeline
Sparvs användarhandledning
Annotationer från Sparv
Webb-API
Web Sparv
Mink
User manual
Övningsexempel
Web API
Privacy and data policy
Lärka
Övriga verktyg
Catta
IT-baserad grammatikinlärning
Data
Frågelåda
Om oss
Personal
Organisation
Språkbanken Text i världen
Språkbanken 50 år
Jubileumsfirande
Doktorandutbildning
Undervisning
Referera till oss
Alumner
Möten och workshoppar
Workshoppar
End of the year workshop 2024
End of the year workshop 2023
Semester workshop 2022
Semester workshop H2021
Semester workshop V2021
Semester workshop H2020
Semester workshop V2020
Forskningsmöten
Gruppmöten
SBX Retreat
SBX Retreat 2024
SBX Retreat 2023
SBX Retreat 2022
Kakor
Internt
Kontakt
Rådgivning