Hoppa till huvudinnehåll

Nytt projekt om en förbättrad OCR-process vid massdigitalisering

24 oktober 2018

Utvärdering och anpassning av en förbättrad OCR-process vid massdigitalisering

För att förbättra produktionen av maskinläsbar text initierade Kungliga biblioteket ett projekt med syfte att utveckla en modul för OCR-bearbetning där centrala parametrar kan justeras för att matcha specifik karaktäristik hos källmaterialet. Detta projekt syftar till att tillsammans med Språkbanken genomföra en formell utvärdering av, samt förbättra detta redskap genom systematiska textanalyser, lexikon och ordlistor med målet att det ska implementeras KB:s massdigitaliseringsprocess för dagstidningar.

Projektet finansieras av Riksbankens Jubileumsfond (RJ) jan 2019 - dec 2020.

Samarbetspartners:
Kungliga biblioteket
Språkbanken

Läs mer om projektet här:
https://www.rj.se/anslag/2018/utvardering-och-anpassning-av-en-forbattrad-ocr-process-vid-massdigitalisering/
och här:
https://svenska.gu.se/aktuellt/nyheter/fulltextnationella-sprakbanken-forbattrar-digitaliseringen-av-dagstidningar.cid1591862