Mathir Träd innehåller 5 manuellt annoterade fornsvenska texter eller textfragment: 'Här sigx aff abotum allum skemptan mykla', en satirisk text om abbotar; första kapitlet av Äldre Västgötalagen, en lagtext från 1200-talet; de första ungefär 20 sidorna av Pentateuchparafrasen, en parafrasering av moseböckerna; de första 5 kapitlen (samt några fragment) av Östgötalagen, en lagtext från 1200-talet; del 1 av Tungulus, Visio Tnugdali, den kortare versionen. Texterna består av mer än 33 000 token och nära 2 500 meningar. Annoteringen finns i PROIEL-XML-filer. Den morfosyntaktiska annoteringen i Mathir Träd följer Menotec-riktlinjerna och är del av annoteringsriktlinjerna/trädbankerna inom PROIEL-familjen. Lemmatiseringen bygger på Söderwalls ordbok och supplement. Resursen sammanställdes inom projektet Mathir, finansierat av Marcus och Amalia Wallenbergs Minnesfond, nr. 2012.0146, av Gerlof Bouma och Yvonne Adesam.
Datacitering
Bouma, Gerlof, & Adesam, Yvonne (2024). MAÞiR Träd (uppdaterad: 2024-04-17). [Data set]. Språkbanken Text. https://doi.org/10.23695/705b-nq35
Ytterligare sätt att citera datamängden.
En fornsvensk trädbank, med lemmata, ordklasser och syntax i stil med PROIEL-korpusarna.
Annotation
Manuellt uppmärkt med information om lemma samt ordklass och dependensstruktur enligt Menotec/PROIEL.
Referenser
H. Eckhoff, K. Bech, Gerlof Bouma, K. Eide, D. Haug, O. E. Haugen, M. Johndal (2018): The PROIEL treebank family: a standard for early attestations of Indo-European languages, in Language Resources and Evaluation, volume 52, issue 1, pages 29-65
Ladda ned
| Fil | Storlek | Modifierad | Licens |
|---|---|---|---|
| 5.49 MB | 2024-04-17 | CC-BY-NC-4.0 |