Kubord-fasttext

Datacitering

Språkbanken (2024). Kubord-fasttext (uppdaterad: 2024-06-11). [Data set]. Bearbetad och distribuerad av Språkbanken. https://doi.org/10.23695/sp99-9h02

Ytterligare sätt att citera datamängden.

En samling fasttext-modeller tränade på moderna tidningstexter från Kungliga biblioteket

Kubord-fasttext är en samling fasttext-modeller, framtagna inom ett samarbete mellan KB-labb och Språkbanken Text, som tränats på samma underliggande data som Kubord 2. Modellerna är tränade på token- och lemmanivå. Verktyget som använts vid träning är Gensim, med följande parameterinställningar: min_n 4, max_n 7, 20 epoker, dim 300 och lr .05.

Datamängder i samlingen

Antal träffar: 12

Resurs	Typ	Språk	Åtkomst
Kubord-fasttext - Aftonbladet 2010–2022 - lemma Fasttext-modell tränad på Aftonbladet 2010–2022	Modell	svenska	Datamängd: kubord-fasttext-afb-2010-2022-lemma.zip 2024-08-05 – 2.94 GB – CC-BY-4.0
Kubord-fasttext - Aftonbladet 2010–2022 - token Fasttext-modell tränad på Aftonbladet 2010–2022	Modell	svenska	Datamängd: kubord-fasttext-afb-2010-2022-token.zip 2024-06-11 – 3.18 GB – CC-BY-4.0
Kubord-fasttext - Aftonbladet 2010–2024 - lemma Fasttext-modell tränad på Aftonbladet 2010–2024	Modell	svenska	Datamängd: kubord-fasttext-afb-2010-2024-lemma.zip 2025-06-18 – 3 GB – CC-BY-4.0
Kubord-fasttext - Aftonbladet 2010–2024 - token Fasttext-modell tränad på Aftonbladet 2010–2024	Modell	svenska	Datamängd: kubord-fasttext-afb-2010-2024-token.zip 2025-06-18 – 3.17 GB – CC-BY-4.0
Kubord-fasttext - Dagens Nyheter 2010–2022 - lemma Fasttext-modell tränad på Dagens Nyheter 2010–2022	Modell	svenska	Datamängd: kubord-fasttext-dn-2010-2022-lemma.zip 2024-08-05 – 2.81 GB – CC-BY-4.0
Kubord-fasttext - Dagens Nyheter 2010–2022 - token Fasttext-modell tränad på Dagens Nyheter 2010–2022	Modell	svenska	Datamängd: kubord-fasttext-dn-2010-2022-token.zip 2024-06-11 – 3.1 GB – CC-BY-4.0
Kubord-fasttext - Dagens Nyheter 2010–2024 - lemma Fasttext-modell tränad på Dagens Nyheter 2010–2024	Modell	svenska	Datamängd: kubord-fasttext-dn-2010-2024-lemma.zip 2025-06-18 – 2.9 GB – CC-BY-4.0
Kubord-fasttext - Dagens Nyheter 2010–2024 - token Fasttext-modell tränad på Dagens Nyheter 2010–2024	Modell	svenska	Datamängd: kubord-fasttext-dn-2010-2024-token.zip 2025-06-18 – 3.1 GB – CC-BY-4.0
Kubord-fasttext - Göteborgsposten 2013–2022 - lemma Fasttext-modell tränad på Göteborgsposten 2013–2022	Modell	svenska	Datamängd: kubord-fasttext-gp-2013-2022-lemma.zip 2024-08-05 – 2.69 GB – CC-BY-4.0
Kubord-fasttext - Göteborgsposten 2013–2022 - token Fasttext-modell tränad på Göteborgsposten 2013–2022	Modell	svenska	Datamängd: kubord-fasttext-gp-2013-2022-token.zip 2024-06-11 – 2.84 GB – CC-BY-4.0
Kubord-fasttext - Göteborgsposten 2013–2024 - lemma Fasttext-modell tränad på Göteborgsposten 2013–2024	Modell	svenska	Datamängd: kubord-fasttext-gp-2013-2024-lemma.zip 2025-06-18 – 2.74 GB – CC-BY-4.0
Kubord-fasttext - Göteborgsposten 2013–2024 - token Fasttext-modell tränad på Göteborgsposten 2013–2024	Modell	svenska	Datamängd: kubord-fasttext-gp-2013-2024-token.zip 2025-06-18 – 2.89 GB – CC-BY-4.0

Datacitering

Datamängder i samlingen

Typ

Språk

Storlek

Skapad

Uppdaterad

Kontakt

DOI