sv-covid-19 är en samling svenska nyhetestexter, vetenskapliga och populärvetenskapliga artiklar och artiklar från vissa bloggar och sociala medier, till exempel Flashback och Twitter, som började publiceras i början av coronaviruspandemin (tidigt 2020). Korpusen består av drygt åtta miljoner ord och 9000 artiklar. Korpusen innehåller olika texttyper och texter med olika stilnivåer. Texterna har märkts upp med ordklasstaggar, morfologisk analys och lemma, samt viss strukturell och funktionell information, som till exempel författarnamn.
Citering
Språkbanken Text (2023). sv-COVID-19 (uppdaterad: 2023-05-29). [Data set]. Språkbanken Text. https://doi.org/10.23695/k6fh-4f59Ytterligare sätt att citera datamängden.
Blandade artiklar relaterade till coronaviruspandemin
Referenser
Dimitrios Kokkinakis (2021): Insights on a Swedish Covid-19 corpus, in CLARIN Annual Conference (Virtual Event). 27 – 29 September 2021. Monica Monachini, Maria Eskevich (red.). s. 31-34
Fil | Storlek | Modifierad | Licens |
---|---|---|---|
200.6 MB | 2023-05-29 |
CC BY 4.0
attribution
|
|
12.47 MB | 2023-05-29 |
CC BY 4.0
attribution
|