Fasttext-modell tränad på Dagens Nyheter 2010–2022
Kubord-fasttext är en samling fasttext-modeller, framtagna inom ett samarbete mellan
KB-labb och Språkbanken Text, som tränats på
samma underliggande data som Kubord 2. Modellerna är
tränade på token- och lemmanivå. Verktyget som använts vid träning är
Gensim, med följande parameterinställningar:
min_n 4, max_n 7, 20 epoker, dim 300 och lr .05.
Datacitering
Språkbanken Text. (2024-06-11). Kubord-fasttext - Dagens Nyheter 2010–2022 - token [Data set]. Språkbanken Text. https://doi.org/10.23695/rnmb-ga21Ytterligare sätt att citera datamängden.
Fil | Storlek | Modifierad | Licens |
---|---|---|---|
kubord-fasttext-dn-2010-2022-token.zip
model
(zip)
|
3.1 GB | 2024-06-11 |
CC BY 4.0
attribution
|