Hoppa till huvudinnehåll

DReaM

En flerspråkig korpus av språkliga beskrivningar av världens naturliga språk.


Den öppna och fritt tillgängliga delen av DReaM-korpusen är en samlingen med tusentals flerspråkiga digitala dokument som beskriver världens språk. Dokumenten är berikade med metadata och språkteknologiska analyser. För mer information hänvisar vi till publikationen som anges nedan, som även är samlingens standardreferens.

Det finns också en lösenordsskyddad del av korpusen som kan hittas här.

Standard reference:
Shafqat Virk, Harald Hammarström, Markus Forsberg, Søren Wichmann (2020): The DReaM Corpus: A Multilingual Annotated Corpus of Grammars for the World’s Languages, in Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020), Marseille, 11–16 May 2020 / Editors : Nicoletta Calzolari, Frédéric Béchet, Philippe Blache, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Hélène Mazo, Asuncion Moreno, Jan Odijk, Stelios Piperidis BibTeX
Fil Storlek Modifierad Licens
dream.zip.bz2
corpus Information (XML)
188.83 MB 2020-11-11 CC BY 4.0
attribution

Typ

  • Korpus

Språk

engelska

Storlek

Meningar: 5 740 264
Token: 75 027 790

Kontakt

Språkbanken Text
sb-info@svenska.gu.se