Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Datamängder

Här kan du leta och filtrera bland våra datamängder. Du kan klicka på en rad för att få fram nedladdningsbara filer. Genom att klicka på verktygsikonen kommer du direkt till gränssnittet där du kan utforska datamängden.
Resurs Typ Språk Åtkomst
Dependensparsningsmodell: Stanza
Förtränade modeller för dependensparsning.
Modell svenska
Engelska inbäddningar (word embeddings)
Förtränade inbäddningar (word embeddings) för engelska wikipedia
Modell engelska
Förtränade inbäddningar
En lista över förtränade inbäddningar för svenska
Modell svenska
Samling
Kubord-fasttext
En samling fasttext-modeller tränade på moderna tidningstexter från Kungliga biblioteket
Modell svenska
Kubord-fasttext - Aftonbladet 2010–2022 - lemma
Fasttext-modell tränad på Aftonbladet 2010–2022
Modell svenska
Kubord-fasttext - Aftonbladet 2010–2022 - token
Fasttext-modell tränad på Aftonbladet 2010–2022
Modell svenska
Kubord-fasttext - Dagens Nyheter 2010–2022 - lemma
Fasttext-modell tränad på Dagens Nyheter 2010–2022
Modell svenska
Kubord-fasttext - Dagens Nyheter 2010–2022 - token
Fasttext-modell tränad på Dagens Nyheter 2010–2022
Modell svenska
Kubord-fasttext - Göteborgsposten 2013–2022 - lemma
Fasttext-modell tränad på Göteborgsposten 2013–2022
Modell svenska
Kubord-fasttext - Göteborgsposten 2013–2022 - token
Fasttext-modell tränad på Göteborgsposten 2013–2022
Modell svenska
Lemmatiseringsmodell: Stanza
Förtränad modell för lemmatisering.
Modell svenska
Ordklasstaggningsmodell: Flair
Förtränade modeller för ordklasstaggning.
Modell svenska
Ordklasstaggningsmodell: Marmot
Förtränade modeller för ordklasstaggning.
Modell svenska
Ordklasstaggningsmodell: Stanza
Förtränade modeller för ordklasstaggning.
Modell svenska
Svenska historiska inbäddningar (word embeddings)
Förtränade inbäddningar (word embeddings) för historisk svenska
Modell svenska
BibTeX list (experimental feature)