Hoppa till huvudinnehåll

Gothenburg Dialogue Corpus (GDC)

GDC är en samling av 360 individuella dialoger transkriberade från inspelningar.
Gothenburg Dialogue Corpus (GDC) är en samling av 360 individuella dialoger transkriberade från inspelningar av cirka 25 olika sociala aktiviteter. Korpusen initierades i slutet av 1970-talet för att möta ett växande intresse för naturalistiska talspråksdata. GDC-data är mycket varierande med tanke på de olika sociala aktiviteterna med avseende på interpunktion, grammatik, ordförråd och språkets och kommunikationens roll i mänskligt socialt liv. Korpusen består av både ljud (50%) och ljud/video (50%) inspelningar av naturligt förekommande interaktioner.

För åtkomst kontakta data@flov.gu.se.
Fil Storlek Modifierad Licens
stats_GDC.txt
Ordstatistik: Information (CSV)
3.95 MB 2017-03-26 CC BY 4.0
attribution

Typ

  • Korpus

Språk

svenska

Storlek

Meningar: 107 700
Token: 1 473 608

Kontakt

Institutionen för filosofi, lingvistik och vetenskapsteori
data@flov.gu.se