UD_Swedish-SweLL är en parallell Universal Dependencies-trädbank baserad på SweLL (Swedish Learner Language-korpusen). Den första versionen, som släpps i samband med UD 2.17, består av 510 meningar parade med sina korrigerade versioner. Meningarna är slumpmässigt utvalda från SweLL-gold, en samling uppsatser skrivna av vuxna inlärare av svenska som andraspråk. För mer information om trädbanken, se den officiella README-filen.
Datacitering
Masciolini, Arianna, Berdicevskis, Aleksandrs, & Szawerna, Maria Irena (2025). UD2.17_Swedish-SweLL (uppdaterad: 2025-11-19). [Data set]. Språkbanken Text. https://doi.org/10.23695/fpnc-1v66
Ytterligare sätt att citera datamängden.
Annotation
Utöver de annoteringar som finns tillgängliga i källkorpusen (pseudonymisering, felklassificering och normalisering) är varje token lemmatiserad, UPOS-taggad och dependensannoterad enligt Universal Dependencies-standarden. Annotatörerna är själva andraspråkstalare.
Förbehåll
- Lemmana, ordklasserna och dependensrelationerna är systematiskt manuellt validerade, medan de morfologiska analyserna kontrollerades endast för token som är markerade som inlärarfel i källkorpusen och/eller vars automatiska lemmatisering, ordklasstaggning och/eller dependensannotering visade sig vara felaktiga.
- Den här resursen innehåller bara en del av de inlärarmetadata som finns tillgängliga för SweLL-gold. För att få tillgång till en version av trädbanken med all metadata, ansök om tillgång till SweLL-gold.
Avsedd användning
(Tvärspråkliga) andraspråksinlärningsstudier, evaluering av dependensparsrar.
Referenser
Elena Volodina, Arianna Masciolini, Beáta Megyesi, Julia Prentice, Lisa Rudebeck, Gunlög Sundberg, Mats Wirén (2025): SweLL with pride: How to put a learner corpus to good use, in Huminfra handbook: Empowering digital and experimental humanities
Guidelines for the annotation of interlanguage phenomena in UD_Swedish-SweLL
Arianna Masciolini, Aleksandrs Berdicevskis, Maria Irena Szawerna, Elena Volodina (2025): Annotating Second Language in Universal Dependencies: a Review of Current Practices and Directions for Harmonized Guidelines, in Proceedings of the Eighth Workshop on Universal Dependencies (UDW, SyntaxFest 2025), pages 153-163
Tillgänglig via
| Åtkomst | Plattform | Licens |
|---|---|---|
|
|
CC-BY-SA-4.0 |
Ladda ned
| Fil | Storlek | Modifierad | Licens |
|---|---|---|---|
| 218.8 KB | 2025-11-19 | CC-BY-SA-4.0 |