Meny

SenSALDO

SenSALDO, SALDO-ingångar och textord med attitydinformation

SenSALDO

Ett svenskt attitydlexikon baserat på SALDO

Jacobo Rouces, Lars Borin, Nina Tahmasebi, Stian Rødven Eide

SenSALDO är ett attitydlexikon för svenska som bygger på det stora svenska semantiska språkteknologiska lexikonet SALDO. SenSALDO har utvecklats inom det VR-finansierade forskningsprogrammet Mot kunskapsbaserad storskalig kunskapsutvinning ur svensk text, med stöd från forskningsinfrastrukturen Swe-Clarin.

SenSALDO v. 0.2 innehåller 12.287 ordbetydelser ur SALDO 2.3 försedda med någon av attitydetiketterna "-1" (negativ), "0" (neutral) eller "1" (positiv). Etiketterna har tilldelats genom en process med automatiska och manuella inslag, som beskrivs i de publikationer som räknas upp nedan. Som sista steg i processen har alla de 12.287 ordbetydelserna korrigerats manuellt.

Förutom listan med attityduppmärkta ordbetydelser innehåller den nedladdningsbara datamängden även en lista med attityduppmärkta ordklassförsedda textord (nästan 85.000 ord).

SenSALDOS ordbetydelser har alltid bara en attitydetikett, men ett textord kan ha fler än en i fall då det motsvarar mer än en ordbetydelse med olika attitydvärden. Se informationen i filernas början.

Om du använder SenSALDO i forskning som resulterar i en publikation, ber vi dig ange en eller flera av nedanstående publikationer som referens.


Publikationer • Publications

  1. Jacobo Rouces, Nina Tahmasebi, Lars Borin, Stian Rødven Eide 2018. SenSALDO: Creating a sentiment lexicon for Swedish. Proceedings of LREC 2018. Miyazaki: ELRA. 4192–4198. <http://www.lrec-conf.org/proceedings/lrec2018/pdf/857.pdf>
  2. Jacobo Rouces, Nina Tahmasebi, Lars Borin, Stian Rødven Eide 2018. Generating a gold standard for a Swedish sentiment lexicon. Proceedings of LREC 2018. Miyazaki: ELRA. 2689–2694. <http://www.lrec-conf.org/proceedings/lrec2018/pdf/846.pdf>
  3. Jacobo Rouces, Lars Borin, Nina Tahmasebi, Stian Rødven Eide 2018. Defining a gold standard for a Swedish sentiment lexicon: Towards higher-yield text mining in the digital humanities. Proceedings of DHN 2018. Aachen: CEUR-WS.org. 219–227. <http://ceur-ws.org/Vol-2084/shortplus7.pdf>

Sammanfattning

Resurstyp lexikon
Språk svenska
Antal ingångar 12,287