Mathir Träd innehåller 5 manuellt annoterade fornsvenska texter eller textfragment: 'Här sigx aff abotum allum skemptan mykla', en satirisk text om abbotar; första kapitlet av Äldre Västgötalagen, en lagtext från 1200-talet; de första ungefär 20 sidorna av Pentateuchparafrasen, en parafrasering av moseböckerna; de första 5 kapitlen (samt några fragment) av Östgötalagen, en lagtext från 1200-talet; del 1 av Tungulus, Visio Tnugdali, den kortare versionen. Texterna består av mer än 33 000 token och nära 2 500 meningar. Annoteringen finns i PROIEL-XML-filer. Den morfosyntaktiska annoteringen i Mathir Träd följer Menotec-riktlinjerna och är del av annoteringsriktlinjerna/trädbankerna inom PROIEL-familjen. Lemmatiseringen bygger på Söderwalls ordbok och supplement. Resursen sammanställdes inom projektet Mathir, finansierat av Marcus och Amalia Wallenbergs Minnesfond, nr. 2012.0146, av Gerlof Bouma och Yvonne Adesam.
Citering
Språkbanken Text (2024). MAÞiR Träd (uppdaterad: 2024-04-17). [Data set]. Språkbanken Text. https://doi.org/10.23695/705b-nq35Ytterligare sätt att citera datamängden.
En fornsvensk trädbank, med lemmata, ordklasser och syntax i stil med PROIEL-korpusarna.
Annotation
Manuellt uppmärkt med information om lemma samt ordklass och dependensstruktur enligt Menotec/PROIEL.
Referenser
H. Eckhoff, K. Bech, Gerlof Bouma, K. Eide, D. Haug, O. E. Haugen, M. Johndal (2018): The PROIEL treebank family: a standard for early attestations of Indo-European languages, in Language Resources and Evaluation, volume 52, issue 1, pages 29-65
Ladda ned
Fil | Storlek | Modifierad | Licens |
---|---|---|---|
mathir_trees_v0.1.tgz
övrigt
(tgz)
|
5.49 MB | 2024-04-17 |
CC BY-NC 4.0
attribution
|