Blandade artiklar relaterade till coronaviruspandemin
sv-covid-19 är en samling svenska nyhetestexter, vetenskapliga och populärvetenskapliga artiklar och artiklar från vissa bloggar och sociala medier, till exempel Flashback och Twitter, som började publiceras i början av coronaviruspandemin (tidigt 2020). Korpusen består av drygt åtta miljoner ord och 9000 artiklar. Korpusen innehåller olika texttyper och texter med olika stilnivåer. Texterna har märkts upp med ordklasstaggar, morfologisk analys och lemma, samt viss strukturell och funktionell information, som till exempel författarnamn.
