Introduktion
Swesaurus Àr ett fritt svenskt ordnÀt, som bygger pÄ sÄ kallade luddiga synonymmÀngder (Àven luddiga synsets). Det ÄteranvÀnder information om lexikalisk-semantiska relationer frÄn flera fritt tillgÀngliga lexikala resurser för svenska.
- SALDO - en lexikalisk-semantisk resurs för svenska
- Synlex - en svensk synonymlista med grad av synonymi
- SDB (Semantisk databas) - en lexikalisk databas
- Wiktionary - ett webbaserat projekt för att kollaborativt skapa ett fritt lexikon
- Princeton Core WordNet
Vi har utforskat tvĂ„ sĂ€tt att koppla synonympar frĂ„n Synlex till ord i SALDO med olika betydelser. Det första handlar om det transitiva höljet. En transitiv relation betyder att om nĂ„got gĂ€ller för A och B, och för B och C, sĂ„ gĂ€ller det ocksĂ„ för A och C. Om vi till exempel veta att en elefant Ă€r större Ă€n en kamel och att en kamel Ă€r större Ă€n en katt, sĂ„ vet vi ocksĂ„ automatiskt att en elefant Ă€r större Ă€n en katt. Synonymi Ă€r en transitiv relation, vilket innebĂ€r att om vi vet att A Ă€r synonymt med B och B med C, sĂ„ följer med automatik att A Ă€r synonymt med C. Med andra ord, synonymparet A-C kan hĂ€rledas frĂ„n de explicit angivna synonymparen A-B och B-C. Den mĂ€ngd objekt man fĂ„r om man rĂ€knar ut alla transitivitetsrelationer för nĂ„got eller nĂ„gra av orden kallas det transitiva höljet. I vĂ„rt fall kan man tĂ€nka pĂ„ det transitiva höljet som en âkedjaâ av ordbetydelser dĂ€r varje lĂ€nk i kedjan ges av ett synonympar. Till exempel, det transitiva höljet för synonymparen barn-parvel, parvel-pys och pys-knatte Ă€r synonymmĂ€ngden {barn, parvel, pys, knatte}. Resultatet blir en uppsĂ€ttning av rimliga synonymmĂ€ngder, men ocksĂ„ en Ă„terstĂ„ende ensam synonymmĂ€ngd med flera tusen ordbetydelser. Vi minskade den största synonymmĂ€ngden genom kravet att en synonymmĂ€ngd endast fĂ„r bestĂ„ av ord i samma ordklass, men antalet ordbetydelser i den kan fortfarande rĂ€knas i tusental.
Den andra metoden för att koppla ihop synonympar Àr klickar. En klick Àr en mÀngd ord dÀr alla Àr synonymer till varandra. BerÀkningen av klickar gav inga onormalt stora synonymmÀngder, men dÀremot andra problem. Till exempel förekommer ordbetydelser ibland i fler Àn en synonymmÀngd, vilket strider mot vad man i ordnÀtssammanhang brukar mena med ordbetydelse. Vi experimenterar med olika sÀtt att hantera detta. Vi kan till exempel utgÄ frÄn de klickar som har en eller flera gemensamma ordbetydelser och hÀrleda saknade synonympar som, om de existerade, skulle förena klickarna till en klick. Detta ger par av god kvalitet.
Resurser
Ladda ner utvecklingsversionen av Swesaurus