MuClaGED

Standardreferens

Judit Casademont Moner, Elena Volodina (2022): Swedish MuClaGED: A new dataset for Grammatical Error Detection in Swedish, i Proceedings of the 11th Workshop on Natural Language Processing for Computer-Assisted Language Learning (NLP4CALL 2022)

Datacitering

Casademont Moner, Judit, & Volodina, Elena (2025). MuClaGED (uppdaterad: 2025-01-19). [Data set]. Bearbetad och distribuerad av Språkbanken. https://doi.org/10.23695/q9v4-vt57

Ytterligare sätt att citera datamängden.

MuClaGED är en datamängd för multi-class Grammatical Error Detection för svenska. Den är baserad på SweLL-gold korpusen.

Dataset description

Data is provided in a tab-separated format consisting of five columns, namely, token id, token, list of error codes for addition, list of error codes for deletion and list of codes for replacement. See more on data format in the standard reference article.

License: CLARIN-ID, -PRIV, -NORED, -BY (https://www.kielipankki.fi/support/clarin-eula/#res).

Annotation

Each token has an error label (high level error type) and edit type that has been applied for correction (addition, deletion and replacement).

Avsedd användning

Grammatical Error Detection and labeling, (Second) Language Acquisiton studies, Learner Corpus Research, Noisy User-produced Data.

Tillgänglig via

Åtkomst	Plattform	Licens
https://sunet.artologik.net/gu/swell		Other

Standardreferens

Datacitering

Dataset description

Annotation

Avsedd användning

Tillgänglig via

Del av samling

Typ

Språk

Storlek

Nyckelord

Skapad av

Uppdaterad

Kontakt

DOI