UD_Swedish-SweLL är en parallell Universal Dependencies-trädbank baserad på SweLL (Swedish Learner Language-korpuset). Den första versionen, som släpps i samband med UD 2.17, består av 510 meningar parade med sina korrigerade versioner. Meningarna är slumpmässigt utvalda från SweLL-gold, en samling uppsatser skrivna av vuxna inlärare av svenska som andraspråk. För mer information om trädbanken, se den officiella README-filen.
Datacitering
Masciolini, Arianna, Berdicevskis, Aleksandrs, & Szawerna, Maria Irena (2025). UD2.17_Swedish-SweLL (uppdaterad: 2025-11-19). [Data set]. Språkbanken Text. https://doi.org/10.23695/fpnc-1v66
Ytterligare sätt att citera datamängden.
En parallell UD-trädbank baserad på SweLL (Swedish Learner Language-korpuset).
Annotation
Utöver de annoteringar som finns tillgängliga i källkorpuset (pseudonymisering, felklassificering och normalisering) är varje token lemmatiserad, UPOS-taggad och dependensannoterad enligt Universal Dependencies-standarden. Annotatörerna är själva andraspråkstalare.
Förbehåll
- Lemmana, ordklasserna och dependensrelationerna är systematiskt manuellt validerade, medan de morfologiska analyserna kontrollerades endast för token som är markerade som inlärarfel i källkorpuset och/eller vars automatiska lemmatisering, ordklasstaggning och/eller dependensannotering visade sig vara felaktiga.
- Den här resursen innehåller bara en del av de inlärarmetadata som finns tillgängliga för SweLL-gold. För att få tillgång till en version av trädbanken med all metadata, ansök om tillgång till SweLL-gold.
Avsedd användning
(Tvärspråkliga) andraspråksinlärningsstudier, evaluering av dependensparsrar.
Tillgänglig via
| Åtkomst | Plattform | Licens |
|---|---|---|
|
|
CC-BY-SA-4.0 |
Ladda ned
| Fil | Storlek | Modifierad | Licens |
|---|---|---|---|
| 218.8 KB | 2025-11-19 | CC-BY-SA-4.0 |