Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Gothenburg Dialogue Corpus (GDC)

Citering Information

Språkbanken Text (2017). Gothenburg Dialogue Corpus (GDC) (uppdaterad: 2017-03-26). [Data set]. Språkbanken Text. https://doi.org/10.23695/p2v4-6g89
BibTeX Ytterligare sätt att citera datamängden.
GDC är en samling av 360 individuella dialoger transkriberade från inspelningar.

Gothenburg Dialogue Corpus (GDC) är en samling av 360 individuella dialoger transkriberade från inspelningar av cirka 25 olika sociala aktiviteter. Korpusen initierades i slutet av 1970-talet för att möta ett växande intresse för naturalistiska talspråksdata. GDC-data är mycket varierande med tanke på de olika sociala aktiviteterna med avseende på interpunktion, grammatik, ordförråd och språkets och kommunikationens roll i mänskligt socialt liv. Korpusen består av både ljud (50%) och ljud/video (50%) inspelningar av naturligt förekommande interaktioner.

För åtkomst kontakta data@flov.gu.se. Innehåller data om talspråk.

Fil Storlek Modifierad Licens
stats_GDC.txt
Ordstatistik: Information (CSV)
3.95 MB 2017-03-26 CC BY 4.0
attribution

Typ

  • Korpus

Språk

svenska

Storlek

Meningar: 107 700
Token: 1 473 608

Updaterad

2017-03-26

Kontakt

Institutionen för filosofi, lingvistik och vetenskapsteori
data@flov.gu.se