Fasttext-modell tränad på Göteborgsposten 2013–2022
Kubord-fasttext är en samling fasttext-modeller, framtagna inom ett samarbete mellan
KB-labb och Språkbanken Text, som tränats på
samma underliggande data som Kubord 2. Modellerna är
tränade på token- och lemmanivå. Verktyget som använts vid träning är
Gensim, med följande parameterinställningar:
min_n 4, max_n 7, 20 epoker, dim 300 och lr .05.
Datacitering
Språkbanken Text. (2024-06-11). Kubord-fasttext - Göteborgsposten 2013–2022 - lemma [Data set]. Språkbanken Text. https://doi.org/10.23695/mwyr-gk24Ytterligare sätt att citera datamängden.
Fil | Storlek | Modifierad | Licens |
---|---|---|---|
kubord-fasttext-gp-2013-2022-lemma.zip
model
(zip)
|
2.69 GB | 2024-08-05 |
CC BY 4.0
attribution
|