En modell baserad på KB/bert-base-swedish-cased tränad med syfte att upptäcka personliga uppgifter, särskilt i studentuppsatser. Den här varianten skiljer mellan 38 detaljerade kategorier samt markerar början och insidan.
Standardreferens
Maria Irena Szawerna, Simon Dobnik, Ricardo Muñoz Sánchez, and Elena Volodina. 2025. The Devil’s in the Details: the Detailedness of Classes Influences Personal Information Detection and Labeling. In Proceedings of the Joint 25th Nordic Conference on Computational Linguistics and 11th Baltic Conference on Human Language Technologies (NoDaLiDa/Baltic-HLT 2025), pages 697–708, Tallinn, Estonia. University of Tartu Library. https://aclanthology.org/2025.nodalida-1.70/
Datacitering
Szawerna, Maria Irena. sbx/KB-bert-base-swedish-cased_PI-detection-detailed-iob [Data set]. Språkbanken Text. https://doi.org/10.23695/w50j-tf54

A model based on KB/bert-base-swedish-cased trained to detect personal information.
Förbehåll
Den här modellen garanterar inte att alla personliga uppgifter i texten upptäcks. Använd den aldrig utan översikt av en människa (human-in-the-loop). Modellen presterar betydligt sämre på texter som inte är student- eller elev uppsatser.
Avsedd användning
Upptäckt av personliga uppgifter
Ladda ned
Fil | Storlek | Modifierad | Licens |
---|---|---|---|
KB-bert-base-swedish-cased_PI-detection-detailed-iob
The model is hosted on HuggingFace and can be easily accessed e.g. using their Python library.
|
110.04 KB | GPL-3.0 |