Hoppa till huvudinnehåll

sbx/KB-bert-swedish_PI-detection-basic

Standardreferens Information

Maria Irena Szawerna, Simon Dobnik, Ricardo Muñoz Sánchez, Elena Volodina (2025): The Devil’s in the Details: the Detailedness of Classes Influences Personal Information Detection and Labeling, i Proceedings of the Joint 25th Nordic Conference on Computational Linguistics and 11th Baltic Conference on Human Language Technologies (NoDaLiDa/Baltic-HLT 2025), March 3–4, 2025 Tallinn, Estonia) / Richard Johansson and Sara Stymne (eds.), sida 697–708 BibTeX

Datacitering Information

Szawerna, Maria Irena. sbx/KB-bert-swedish_PI-detection-basic [Data set]. Bearbetad och distribuerad av Språkbanken. https://doi.org/10.23695/e3v2-w708
BibTeX Ytterligare sätt att citera datamängden.
A model based on KB/bert-base-swedish-cased trained to detect personal information.

En modell baserad på KB/bert-base-swedish-cased tränad med syfte att upptäcka personliga uppgifter, särskilt i studentuppsatser. Den här varianten skiljer endast mellan personlig och icke-personlig.

Förbehåll

Den här modellen garanterar inte att alla personliga uppgifter i texten upptäcks. Använd den aldrig utan översikt av en människa (human-in-the-loop). Modellen presterar betydligt sämre på texter som inte är student- eller elev uppsatser.

Avsedd användning

Upptäckt av personliga uppgifter

Ladda ned

Fil Storlek Modifierad Licens
KB-bert-swedish_PI-detection-basic
The model is hosted on HuggingFace and can be easily accessed e.g. using their Python library.
145.84 KB GPL-3.0

Typ

  • Modell

Språk

svenska

Storlek

Nyckelord

  • PI detection
  • BERT

Skapad av

  • Szawerna, Maria Irena

Skapad

2024-07-07

Kontakt

sb-info@svenska.gu.se