Blandade artiklar relaterade till coronaviruspandemin
sv-covid-19 är en samling svenska nyhetestexter, vetenskapliga och
populärvetenskapliga artiklar och artiklar från vissa bloggar och
sociala medier, till exempel Flashback och Twitter, som började
publiceras i början av coronaviruspandemin (tidigt 2020). Korpusen
består av drygt åtta miljoner ord och 9000 artiklar. Korpusen
innehåller olika texttyper och texter med olika stilnivåer. Texterna
har märkts upp med ordklasstaggar, morfologisk analys och lemma, samt
viss strukturell och funktionell information, som till exempel
författarnamn.
Referenser
- Dimitrios Kokkinakis (2021): Insights on a Swedish Covid-19 corpus, in CLARIN Annual Conference (Virtual Event). 27 – 29 September 2021. Monica Monachini, Maria Eskevich (red.). s. 31-34
Fil | Storlek | Modifierad | Licens |
---|---|---|---|
200.6 MB | 2023-05-29 |
CC BY 4.0
attribution
|
|
12.47 MB | 2023-05-29 |
CC BY 4.0
attribution
|