Nyhetstexter från svt.se Sammanfattning Resurstyp Corpus Språk svenska Tokens 18 817 638 Sentences 1 231 355 Ladda ned svt-2018.xml.bz2 corpus (XML) scrambled licens: CC BY 4.0 (attribution) stats_svt-2018.csv token frequencies (CSV) licens: CC BY 4.0 (attribution)