Hoppa till huvudinnehåll

DReaM-Copyright-Protected

En flerspråkig korpus av språkliga beskrivningar av världens naturliga språk.


Den skyddade delen av DReaM-korpusen — som är skyddad på grund av upphovsrättsliga hänsynstaganden — består av tusentals flerspråkiga digitala dokument som beskriver världens språk. Dokumenten är berikade med metadata och språkteknologiska analyser. För mer information hänvisar vi till publikationen som anges nedan, som även utgör samlingens standardreferens.

Det finns också en öppet tillgänglig del av korpusen som kan hittas här.

Standard reference:
Shafqat Virk, Harald Hammarström, Markus Forsberg, Søren Wichmann (2020): The DReaM Corpus: A Multilingual Annotated Corpus of Grammars for the World’s Languages, in Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020), Marseille, 11–16 May 2020 / Editors : Nicoletta Calzolari, Frédéric Béchet, Philippe Blache, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Hélène Mazo, Asuncion Moreno, Jan Odijk, Stelios Piperidis BibTeX
Resurstyp Corpus
Språk
Tokens 225 617 801
Sentences 34 350 897

Kontakt

Språkbanken Text (sb-info@svenska.gu.se)