Hoppa till huvudinnehåll

Blog posts

Optical Character Recognition (OCR) of Swedish texts

Torsdag den 16 maj organiserade Språkbanken Text en workshop om Swedish OCR (Optical Character Recognition) och HTR (Hand Written Text Recognition). Syftet med workshopen var att

Jubileumsarkivet: En ny datasamling om Göteborgsutställningen

I helgen drog Göteborgs 400-årsjubileum igång. Vi tar härmed tillfället i akt och gratulerar Göteborg genom att gå ett hundra år tillbaka i tiden för att lära oss mer om staden och tiden då 300-årsjubileum firades med en storslagen Jubileumsutställning.

The Kubhist corpus of Swedish newspapers

Among the flurry of Språkbanken’s historical resources we find the Kubhist corpus – a diachronic collection of historical newspaper texts – in two versions: Kubhist 1 spanning the time period of 1750–1950, and Kubhist 2 spanning the time period of 1645–1926. Historical corpora of this kind, especially when available in searchable format, are valuable sources of information for learning about our history, language and culture.