En samling fasttext-modeller tränade på moderna tidningstexter från Kungliga biblioteket
Kubord-fasttext är en samling fasttext-modeller, framtagna inom ett samarbete mellan
KB-labb och Språkbanken Text, som tränats på
samma underliggande data som Kubord 2. Modellerna är
tränade på token- och lemmanivå. Verktyget som använts vid träning är
Gensim, med följande parameterinställningar:
min_n 4, max_n 7, 20 epoker, dim 300 och lr .05.
Datacitering
Språkbanken Text (2024). Kubord-fasttext (uppdaterad: 2024-06-11). [Data set]. Språkbanken Text. https://doi.org/10.23695/sp99-9h02Ytterligare sätt att citera datamängden.
Delresurser
- (experimental feature)