Kubord-fasttext - Dagens Nyheter 2010–2022 - token

Datacitering

Språkbanken (2024). Kubord-fasttext - Dagens Nyheter 2010–2022 - token (uppdaterad: 2024-06-11). [Data set]. Bearbetad och distribuerad av Språkbanken. https://doi.org/10.23695/rnmb-ga21

Ytterligare sätt att citera datamängden.

Fasttext-modell tränad på Dagens Nyheter 2010–2022

Kubord-fasttext är en samling fasttext-modeller, framtagna inom ett samarbete mellan KB-labb och Språkbanken Text, som tränats på samma underliggande data som Kubord 2. Modellerna är tränade på token- och lemmanivå. Verktyget som använts vid träning är Gensim, med följande parameterinställningar: min_n 4, max_n 7, 20 epoker, dim 300 och lr .05.

Ladda ned

Fil	Storlek	Modifierad	Licens
kubord-fasttext-dn-2010-2022-token.zip model (zip)	3.1 GB	2024-06-11	CC-BY-4.0

Del av samling

Kubord-fasttext

Typ

Modell

Språk

svenska

Storlek

Skapad

2024-06-11

Uppdaterad

2024-06-11

Kontakt

sb-info@svenska.gu.se

DOI

https://doi.org/10.23695/rnmb-ga21

Sidansvarig: Språkbanken Text

Sidan uppdaterades: 2026-04-30