En flerspråkig korpus av språkliga beskrivningar av världens naturliga språk.
Den öppna och fritt tillgängliga delen av DReaM-korpusen är en samlingen med tusentals flerspråkiga digitala dokument som beskriver världens språk. Dokumenten är berikade med metadata och språkteknologiska analyser. För mer information hänvisar vi till publikationen som anges nedan, som även är samlingens standardreferens.
Det finns också en lösenordsskyddad del av korpusen som kan hittas här.
- Standard reference:
- Shafqat Virk, Harald Hammarström, Markus Forsberg, Søren Wichmann (2020): The DReaM Corpus: A Multilingual Annotated Corpus of Grammars for the World’s Languages, in Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020), Marseille, 11–16 May 2020 / Editors : Nicoletta Calzolari, Frédéric Béchet, Philippe Blache, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Hélène Mazo, Asuncion Moreno, Jan Odijk, Stelios Piperidis