Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Kubhist

Citering Information

Språkbanken Text. Kubhist [Data set]. Språkbanken Text. https://doi.org/10.23695/h7qd-bj40
BibTeX Ytterligare sätt att citera datamängden.
Diakronisk samling av historisk tidsskriftstext på svenska från perioden 1749–1926

Korpussamlingen Kubhist är ett resultat av projektet Digidaily som var ett utvecklingsprojekt där Riksarkivet tillsammans med Kungliga biblioteket och Mittuniversitetet utvecklade rationella metoder och processer för massdigitalisering och texttolkning av dagstidningar. Projektet löpte mellan 2010 och 2014.

Samlingen är uppdelad efter tidning och årtionde.

Annotation

Materialet i Kubhist är försett med en mängd metadata, t.ex. uppgifter om tidningarnas pris, tryckort, utgivningsfrekvens, politiska tendens och publikationsperiod. Informationen är hämtad från KB:s Nya Lundstedt dagstidningar.

Förbehåll

Texternas kvalitet är mycket varierande, bl.a. beroende på ojämnt tryck och fläckar på de fotokopierade förlagorna. Många tidningsnummer inleds med märkliga haranger av tecken då OCR-läsningen försökt tolka vinjetter och dekorationer kring tidningsnamnen som bokstäver. Den digitala texten blir emellertid genast läsligare så fort den nått den del av förstasidan där artiklarna börjar.

Referenser

Datamängder i samlingen

Typ

  • Korpus
  • Samling

Språk

svenska

Storlek

Resurser: 78

Kontakt

Språkbanken Text
sb-info@svenska.gu.se