En fornsvensk trädbank, med lemmata, ordklasser och syntax i stil med PROIEL-korpusarna.
Mathir Träd innehåller 5 manuellt annoterade fornsvenska texter eller
textfragment: 'Här sigx aff abotum allum skemptan mykla', en satirisk
text om abbotar; första kapitlet av Äldre Västgötalagen, en lagtext från
1200-talet; de första ungefär 20 sidorna av Pentateuchparafrasen, en
parafrasering av moseböckerna; de första 5 kapitlen (samt några fragment)
av Östgötalagen, en lagtext från 1200-talet; del 1 av Tungulus, Visio
Tnugdali, den kortare versionen. Texterna består av mer än 33 000 token
och nära 2 500 meningar. Annoteringen finns i PROIEL-XML-filer. Den
morfosyntaktiska annoteringen i Mathir Träd följer Menotec-riktlinjerna
och är del av annoteringsriktlinjerna/trädbankerna inom PROIEL-familjen.
Lemmatiseringen bygger på Söderwalls ordbok och supplement. Resursen
sammanställdes inom projektet Mathir, finansierat av Marcus och Amalia
Wallenbergs Minnesfond, nr. 2012.0146, av Gerlof Bouma och Yvonne
Adesam.
Annotation
Manuellt uppmärkt med information om lemma samt ordklass och dependensstruktur enligt Menotec/PROIEL.
Referenser
- H. Eckhoff, K. Bech, Gerlof Bouma, K. Eide, D. Haug, O. E. Haugen, M. Johndal (2018): The PROIEL treebank family: a standard for early attestations of Indo-European languages, in Language Resources and Evaluation, volume 52, issue 1, pages 29-65
Fil | Storlek | Modifierad | Licens |
---|---|---|---|
mathir_trees_v0.1.tgz
övrigt
(tgz)
|
5.49 MB | 2024-04-17 |
CC BY-NC 4.0
attribution
|