Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Datamängder

Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden.
Resurs Typ Språk Åtkomst
SweLL-gold
Uppsatser skrivna av vuxenstuderande i svenska, manuellt pseudonymiserade och annoterade med felkategorier. Korpusen innehåller både originaltexten och en normaliserad version av varje uppsats. Insamlingperiod 2017-2020.
Korpus svenska
Samling
SweLL-pilot
Uppsatser skrivna av vuxenstuderande i svenska, annoterade med CEFR nivåerna (en Europeisk skala med färdighetsnivåer inom språkinlärningen). Uppsatserna samlades under perioden 2006-2015.
Korpus svenska
SweLLex
SweLLex är en ordlista med produktivt ordförråd för elever med svenska som andraspråk
Lexikon svenska
SweNLI 1.0
A Swedish NLI dataset
Korpus svenska
SweSAT Högskoleprovet ordförståelse 1.1
Högskoleprovet ordförståelse
Lexikon svenska
Swesaurus
Ett svenskt ordnät
Lexikon svenska
SweWiC 2.0
En svensk ord-i-sammanhang datamängd
Korpus svenska
SweWinogender 2.0
En svensk datamängd för koreferens och könsbias
Korpus svenska
SweWinograd 2.0
En svensk datamängd för pronomentolkning
Korpus svenska
Syntag trädbank
En svensk trädbank med syntaktisk analys av 158 artiklar ur Press-65.
Korpus svenska
Sæmundaredda
Forntida isländsk poesi även känd som The King's Book
Korpus fornisländska
TalbankenSBX
Talbanken är en svensk trädbank. Detta är Språkbanken Texts version av Talbanken.
Korpus svenska
TalbankenSTB
Talbanken är en svensk trädbank.
Korpus svenska
The English-Swedish Parallel Corpus (ESPC)
ESPC är en kombinerad jämförbar och parallell korpus lämplig för tvärspråkig forskning för olika typer.
Korpus svenska, engelska
The Swedish Culturomics Gigaword Corpus
En miljard ord ur svenska korpusar från 1950 och framåt. Kod för att extrahera data från korpusen, samt användningsinstruktioner, kan laddas ner från https://svn.spraakbanken.gu.se/sb-arkiv/tools/gigaword/
Korpus svenska
The Swedish PoliGraph
En utvidgbar kunskapsgraf med information om Riksdagens ledamöter
Lexikon svenska
Tiden
30 årgångar av den socialistiska tidskriften Tiden, 1909–1940
Korpus svenska
TISUS v1
Korpus svenska
TISUS-texter
Essays written by L2 Swedish learners as part of a TISUS exam
Korpus svenska
TISUS-texter v2
Korpus svenska
Samling
Tvåkammarriksdagen
Samling av textdokument från Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Berättelser, redogörelser, framställningar
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Betänkanden, memorial, utlåtanden
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Motioner
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Propositioner, skrivelser
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Protokoll
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Register
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Reglementen, svensk författningssamling
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Riksdagens författningssamling RFS
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Riksdagsakter
Del av Ståndsriksdagen
Korpus svenska
Tvåkammarriksdagen: Riksdagsskrivelser
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Utredningar, EU-förslag, betänkande, statens offentliga utredningar
Del av Tvåkammarriksdagen
Korpus svenska
Twitter: Partiledardebatt juni 2013
Material från Twitter, insamlat under partiledardebatten 12 juni 2013 samt några dagar före och efter
Korpus svenska
Twitter: Partiledardebatt maj 2014
Material från Twitter, insamlat under partiledardebatten 4 maj 2014 samt några dagar före och efter
Korpus svenska
Twitter: Partiledardebatt oktober 2013
Material från Twitter, insamlat under partiledardebatten 6 oktober 2013 samt några dagar före och efter
Korpus svenska
Twittermix
Material från ett urval av svenska Twitteranvändare. Uppdateras regelbundet.
Korpus svenska
UNSC-Graph
En utvidgbar kunskapsgraf för UNSC-korpusen med detaljer om deltagare och debatter från FN:s säkerhetsråd 1995-2020
Lexikon engelska
Ur Dagens Krönika
Åtta årgångar av kulturtidskriften Ur Dagens Krönika, 1881–1890
Korpus svenska
Samling
Webbnyheter
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Webbnyheter 2001
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Webbnyheter 2002
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Webbnyheter 2003
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Webbnyheter 2004
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Webbnyheter 2005
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Webbnyheter 2006
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Webbnyheter 2007
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Webbnyheter 2008
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Webbnyheter 2009
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Webbnyheter 2010
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Webbnyheter 2011
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Webbnyheter 2012
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Webbnyheter 2013
Nyheter från svenska dagstidningars webbplatser
Korpus svenska
Wexjöbladet 1820-talet
Del av samlingen Kubhist2
Korpus svenska
WordNet-SALDO
En länkning mellan SALDO och Core WordNet
Lexikon svenska, engelska
WordReference
En stor korpus av skriftligt tal av modersmåls- och icke-modersmålstalare i fyra språk.
Korpus engelska, spanska, franska, italienska
Yrkesbeteckningar
En lista över yrkesbeteckningar på svenska
Lexikon svenska
BibTeX list