Hoppa till huvudinnehåll

Språkresurser

Här kan du leta och filtrera bland våra korpusar och lexikon. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på Korp- eller Karp-ikonen kommer du direkt till gränssnittet där du kan utforska resursen.
Resurs Sortera fallande Typ Språk Åtkomst
Somaliska: Maaddooyinka Kale 1972–79
Korpus somali
Somaliska: Raadiyaha Denmark 2014
Korpus somali
Somaliska: Raadiyaha Iswiidhan 2014
Korpus somali
Somaliska: Saynis 1980–89
Korpus somali
Somaliska: Sheekooyin Carruureed
Korpus somali
Somaliska: Sheekooyin Carruureed (Turjuman)
Korpus somali
Somaliska: Sheekooyin Gaagaaban
Korpus somali
Somaliska: Suugaan
Korpus somali
Somaliska: Suugaan (Turjuman)
Korpus somali
Somaliska: Suugaan 2
Korpus somali
Somaliska: Taariikh iyo Dhaqan (Turjuman)
Korpus somali
Somaliska: Xisaab 2001 Soomaaliya
Korpus somali
Somaliska: Xisaab 2016 Somaliland
Korpus somali
SpIn v1
256 essays collected from Language Introduction course (mid-term exams) for newly arrived refugees. Some of the students are recurrent.
Korpus svenska
Sportanglicismer
Engelska lånord i svenska sportspalter
Lexikon svenska
Språkprov SO 2009
De drygt 94 000 språkexemplen är hämtade ur Svensk ordbok utgiven av Svenska Akademien (2009). Exemplens uppgift är att stödja ordboksdefinitionerna och att ge information om uppslagsordens fraseologi. <br><br>För åtkomst kontakta <a href="mailto:emma.skoldberg@svenska.gu.se">Emma Sköldberg</a>.
Korpus svenska
Stockholms stads tänkeböcker
Protokoll och minnesanteckningar från Stockholms rådhusrätt, år 1626.
Korpus svenska
SUC 2.0
Stockholm-Umeå-korpus 2.0
Korpus svenska
SUC 3.0
Stockholm-Umeå-korpus 3.0
Korpus svenska
SUC-romaner (StorSUC)
Stockholm-Umeå-korpus
Korpus svenska
SUCX 2.0
Stockholm-Umeå-korpus 2.0 omkastad
Korpus svenska
SUCX 3.0
Stockholm-Umeå-korpus 3.0 omkastad
Korpus svenska
Samling
SuperLim 2
A standardized suite for evaluation and analysis of Swedish natural language understanding systems.
Korpus svenska
SuperSim (paketterat för Superlim) 2.0
En datamängd för betydelsemässig likhet och koppling mellan svenska ord.
Korpus svenska
sv-COVID-19
Blandade artiklar relaterade till coronaviruspandemin
Korpus svenska
Svensk ABSAbank
Svensk annoterad korpus för aspektbaserad attitydanalys
Korpus svenska
Svensk ABSAbank-Imm 1.1
Svensk annoterad korpus för aspektbaserad attitydanalys (en version av Absabank)
Korpus svenska
Svensk analogi 2.0
Svensk semantisk och syntaktisk likhet
Korpus svenska
Svensk EAT: frågeklassifikation
En översättning av QAQC datamängden för klassificering av typer av det förväntade svaret
Korpus svenska
Svensk författningssamling
Svensk författningssamling 1880-01-01 – 2012-08-16
Korpus svenska
Svensk fraktur 1626-1816
Ett urval av svensk fraktur texter tryckta mellan 1626 och 1816 från samlingarna på Universitetsbiblioteket vid Göteborgs universitet (UB). För OCR analys.
Korpus svenska
Svensk prosafiktion 1800–1900
All svensk skönlitteratur som trycktes första gången åren 1800, 1820, 1840, 1860, 1880 och 1900
Korpus svenska
Svensk Tidskrift
27 årgångar av den konservativa idétidskriften Svensk Tidskrift, mellan 1891 och 1940
Korpus svenska
Svensk trädbank
En svensk trädbank med återanvändning av existerande resurser
Korpus svenska
Svensk Twitter 2015
Material från ett urval av svenskspråkiga Twitteranvändare från 2015
Korpus svenska
Svensk Twitter 2016
Material från ett urval av svenskspråkiga Twitteranvändare från 2016
Korpus svenska
Svensk Twitter 2017
Material från ett urval av svenskspråkiga Twitteranvändare från 2017
Korpus svenska
Svensk-finska ordlistor
Svensk-finska ordlistor inom olika ämnesområden
Lexikon svenska
Svenska historiska inbäddningar (word embeddings)
Förtränade inbäddningar (word embeddings) för historisk svenska
Modell svenska
Svenska ord, LEXIN
Lexikon för invandrare. Andra upplagan
Lexikon svenska, albanska, bosniska, engelska, finska, modern greek (1453-), kroatiska, kurdiska, iranian persian, ryska, serbiska, somali, spanska, turkiska
Svenska partiprogram och valmanifest
De svenska partiernas partiprogram och valmanifest 1887–2022
Korpus svenska
Svenska tidningar 1818-1870
Ett urval av svenska tidningar tryckta mellan 1818 och 1870 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
Korpus svenska
Svenska tidningar 1871-1906
Ett urval av svenska tidningar tryckta mellan 1871 och 1906 från samlingarna på Kungliga biblioteket (KB). För OCR analys.
Korpus svenska
Svenska Wikipedia
Korpus av svenskspråkiga Wikipedia
Korpus svenska
Svenskt frasnät (SweFN)
En lexikalisk-semantisk resurs baserad på samma principer som engelska Berkeley FrameNet. Denna del av resursen innehåller korpusexemplen, automatiskt annoterade med språklig information.
Korpus svenska
Svenskt frasnät (SweFN)
En lexikal-semantisk resurs baserad på samma principer som engelska Berkeley FrameNet. Denna del av resursen innehåller de semantiska ramarna och det manuellt annoterade semantiska innehållet.
Lexikon svenska
SveParafras 2.0
Referensdatan för semantisk textjämförelse (STS Benchmark)
Korpus svenska
Samling
SVT nyheter
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2004
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2005
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2006
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2007
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2008
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2009
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2010
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2011
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2012
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2013
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2014
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2015
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2016
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2017
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2018
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2019
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2020
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2021
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2022
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter 2023
Nyhetstexter från svt.se
Korpus svenska
SVT nyheter okänt datum
Nyhetstexter från svt.se
Korpus svenska
SW1203-uppsatser
Essays written by L2 Swedish language learners, university courses
Korpus svenska
Swe-NERC
En resurs för träning och utvärdering av igenkänning av namngiven entitet för svenska.
Korpus svenska
Swedbergs Swensk ordabok
Swedbergs Swensk Ordabok
Lexikon svenska, latin
Swedbergs Swensk ordabok (morfologi, f.n. rudimentär)
Swedbergs Swensk Ordabok (morfologi, f.n. rudimentär)
Lexikon svenska
SweDiagnostics
Svenska versionen av (Super)GLUE diagnostik
Korpus svenska
SweDN 1.0
A Swedish text summarization corpus
Korpus svenska
SweFAQ 2.0
Vanliga frågor från svenska myndigheters webbsidor med svar i randomiserad ordning
Korpus svenska
SweLL-gold
Uppsatser svrivna av vuxenstuderande i svenska, manuellt pseudonymiserade och annoterade med felkategorier. Korpusen innehåller både originaltexten och en normaliserad version av varje uppsats. Insamlingperiod 2017-2020.
Korpus svenska
Samling
SweLL-pilot
Uppsatser svrivna av vuxenstuderande i svenska, manuellt anonymiserade och annoterade med felkategorier. Korpusen innehåller både originaltexten och en normaliserad version av varje uppsats. Insamlingperiod 2006-2015.
Korpus svenska
SweNLI 1.0
A Swedish NLI dataset
Korpus svenska
SweSAT Högskoleprovet ordförståelse 1.1
Högskoleprovet ordförståelse
Lexikon svenska
Swesaurus
Ett svenskt ordnät
Lexikon svenska
SweWiC 2.0
En svensk ord-i-sammanhang datamängd
Korpus svenska
SweWinogender 2.0
En svensk datamängd för koreferens och könsbias
Korpus svenska
SweWinograd 2.0
En svensk datamängd för pronomentolkning
Korpus svenska
Syntag trädbank
En svensk trädbank med syntaktisk analys av 158 artiklar ur Press-65.
Korpus svenska
Sæmundaredda
Forntida isländsk poesi även känd som The King's Book
Korpus fornisländska
TalbankenSBX
Talbanken är en svensk trädbank. Detta är Språkbanken Texts version av Talbanken.
Korpus svenska
TalbankenSTB
Talbanken är en svensk trädbank.
Korpus svenska
The English-Swedish Parallel Corpus (ESPC)
ESPC är en kombinerad jämförbar och parallell korpus lämplig för tvärspråkig forskning för olika typer.
Korpus svenska, engelska
The Swedish Culturomics Gigaword Corpus
En miljard ord ur svenska korpusar från 1950 och framåt. Kod för att extrahera data från korpusen, samt användningsinstruktioner, kan laddas ner från https://svn.spraakdata.gu.se/sb-arkiv/tools/gigaword/
Korpus svenska
Tiden
30 årgångar av den socialistiska tidskriften Tiden, 1909–1940
Korpus svenska
TISUS-texter
Essays written by L2 Swedish learners as part of a TISUS exam
Korpus svenska
Samling
Tvåkammarriksdagen
Samling av textdokument från Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Berättelser, redogörelser, framställningar
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Betänkanden, memorial, utlåtanden
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Motioner
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Propositioner, skrivelser
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Protokoll
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Register
Del av Tvåkammarriksdagen
Korpus svenska
Tvåkammarriksdagen: Reglementen, svensk författningssamling
Del av Tvåkammarriksdagen
Korpus svenska