Hoppa till huvudinnehåll

SenSALDO

SenSALDO, SALDO-ingångar och textord med attitydinformation

SenSALDO

Ett svenskt attitydlexikon baserat på SALDO

Jacobo Rouces, Lars Borin, Nina Tahmasebi, Stian Rødven Eide

SenSALDO är ett attitydlexikon för svenska som bygger på det stora svenska semantiska språkteknologiska lexikonet SALDO. SenSALDO har utvecklats inom det VR-finansierade forskningsprogrammet Mot kunskapsbaserad storskalig kunskapsutvinning ur svensk text, med stöd från forskningsinfrastrukturen Swe-Clarin.

SenSALDO v. 0.2 innehåller 12.287 ordbetydelser ur SALDO 2.3 försedda med någon av attitydetiketterna "-1" (negativ), "0" (neutral) eller "1" (positiv). Etiketterna har tilldelats genom en process med automatiska och manuella inslag, som beskrivs i de publikationer som räknas upp nedan. Som sista steg i processen har alla de 12.287 ordbetydelserna korrigerats manuellt.

Förutom listan med attityduppmärkta ordbetydelser innehåller den nedladdningsbara datamängden även en lista med attityduppmärkta ordklassförsedda textord (nästan 85.000 ord).

SenSALDOS ordbetydelser har alltid bara en attitydetikett, men ett textord kan ha fler än en i fall då det motsvarar mer än en ordbetydelse med olika attitydvärden. Se informationen i filernas början.

Om du använder SenSALDO i forskning som resulterar i en publikation, ber vi dig ange en eller flera av nedanstående publikationer som referens.


Publikationer • Publications

  1. Jacobo Rouces, Nina Tahmasebi, Lars Borin, Stian Rødven Eide (2018): SenSALDO: Creating a Sentiment Lexicon for Swedish, in LREC 2018, Eleventh International Conference on Language Resources and Evaluation, 7-12 May 2018, Miyazaki (Japan) BibTeX
  2. Jacobo Rouces, Nina Tahmasebi, Lars Borin, Stian Rødven Eide (2018): Generating a Gold Standard for a Swedish Sentiment Lexicon, in LREC 2018, Eleventh International Conference on Language Resources and Evaluation, May 7-12, 2018, Miyazaki (Japan) BibTeX
  3. Jacobo Rouces, Lars Borin, Nina Tahmasebi, Stian Rødven Eide (2018): Defining a gold standard for a Swedish sentiment lexicon: Towards higher-yield text mining in the digital humanities, in CEUR Workshop Proceedings vol. 2084. Proceedings of the Digital Humanities in the Nordic Countries 3rd Conference Helsinki, Finland, March 7-9, 2018. Edited by Eetu Mäkelä Mikko Tolonen Jouni Tuominen BibTeX

Kontakt

Språkbanken (sb-info@svenska.gu.se)