Utvärdering och anpassning av en förbättrad OCR-process vid massdigitalisering
För att förbättra produktionen av maskinläsbar text initierade Kungliga biblioteket ett projekt med syfte att utveckla en modul för OCR-bearbetning där centrala parametrar kan justeras för att matcha specifik karaktäristik hos källmaterialet. Detta projekt syftar till att tillsammans med Språkbanken genomföra en formell utvärdering av, samt förbättra detta redskap genom systematiska textanalyser, lexikon och ordlistor med målet att det ska implementeras KB:s massdigitaliseringsprocess för dagstidningar.
Projektet finansieras av Riksbankens Jubileumsfond (RJ) jan 2019 - dec 2020.
Samarbetspartners:
Kungliga biblioteket
Språkbanken
Läs mer om projektet här:
https://www.rj.se/anslag/2018/utvardering-och-anpassning-av-en-forbattrad-ocr-process-vid-massdigitalisering/
och här:
https://svenska.gu.se/aktuellt/nyheter/fulltextnationella-sprakbanken-forbattrar-digitaliseringen-av-dagstidningar.cid1591862