En modell baserad på KB/bert-base-swedish-cased tränad med syfte att upptäcka personliga uppgifter, särskilt i studentuppsatser. Den här varianten skiljer mellan 7 generella kategorier samt markerar början och insidan.
Standardreferens
Maria Irena Szawerna, Simon Dobnik, Ricardo Muñoz Sánchez, and Elena Volodina. 2025. The Devil’s in the Details: the Detailedness of Classes Influences Personal Information Detection and Labeling. In Proceedings of the Joint 25th Nordic Conference on Computational Linguistics and 11th Baltic Conference on Human Language Technologies (NoDaLiDa/Baltic-HLT 2025), pages 697–708, Tallinn, Estonia. University of Tartu Library. https://aclanthology.org/2025.nodalida-1.70/
Datacitering
Szawerna, Maria Irena. sbx/KB-bert-base-swedish-cased_PI-detection-general-iob [Data set]. Språkbanken Text. https://doi.org/10.23695/nm9x-z436

A model based on KB/bert-base-swedish-cased trained to detect personal information.
Förbehåll
Den här modellen garanterar inte att alla personliga uppgifter i texten upptäcks. Använd den aldrig utan översikt av en människa (human-in-the-loop). Modellen presterar betydligt sämre på texter som inte är student- eller elev uppsatser.
Avsedd användning
Upptäckt av personliga uppgifter
Ladda ned
Fil | Storlek | Modifierad | Licens |
---|---|---|---|
KB-bert-base-swedish-cased_PI-detection-general-iob
The model is hosted on HuggingFace and can be easily accessed e.g. using their Python library.
|
109.69 KB | GPL-3.0 |