Meny

Nyheter

Image news item
Automatisk identifiering av lexikosemantiska förändringar, alltså möjligheten att med datorers hjälp hitta när ord förändrar sina betydelser över tid, är ett aktivt forskningsfält inom språkteknologi. Towards Computational Lexical Semantic Change Detection är ett forskningsprojekt som knyter an till fältet. Projektet, som startade i januari 2019, finansieras av Vetenskapsrådet och leds av Nina Tahmasebi, docent vid Språkbanken Text, Institutionen för svenska språket på Göteborgs universitet.

Ett av de stora problemen inom fältet rör bristen på öppna testdata av god kvalité som bidrar till jämförbara metoder. Språkbanken är med i en shared task (forskningstävling) som syftar till att jämföra modeller på öppna data med en gemensamt satt standard med hjälp av hög-kvalitativa, manuellt annoterade datamängder för engelska, svenska, tyska och latin. Tävlingen, som organiseras under SemEval2020-flagg, drog igång den 19 februari 2020 och kör i ytterligare en månad.

I nu läget har vi släppt testdata för samtliga språk (de svenska delkorpusarna bygger på Kubhist2 och finnas att hitta här: https://zenodo.org/record/3672950), samt ett gäng med testord som skall klassificeras. Efter tävlingens slut kommer vi även att släppa ground truth (alltså resultaten baserat på den manuella uppmärkning som gjorts under hösten och vintern) för vidare utveckling och andra uppgifter.

Den som vill delta i tävlingen, eller ladda ner data för de andra språken, kan hitta mer information på SemEval 2020 Task 1: Unsupervised Lexical Semantic Change Detection. De officiella resultaten presenteras på SemEval2020 workshopen under Coling2020 i Barcelona i år.  

Mer information om projektet Towards Computational Lexical Semantic Change Detection finns på https://languagechange.org/.

Höstworkshop 2019 bild

Den 17 oktober anordnar Nationella språkbanken en heldagsworkshop i Uppsala. Dagen kommer framför allt att handla om digitalt tillgängliggörande av material för humanistisk och samhällsvetenskaplig forskning. Kort sagt om digital humaniora.

Information och anmälan

Peter Ljunglof picture
Nationella språkbanken på institutionen för svenska språket vid Göteborgs universitet ska hjälpa Arbetsförmedlingen i sitt nya uppdrag.

Under våren kommer Språkbanken att träna en ny språkmodell med hjälp av AI, väl på plats ska modellen bidra till att automatisera Arbetsförmedlingens analysarbete. Peter Ljunglöf och Dan Rosén är ansvariga för arbetet med att träna språkmodellen. 

Läs mer på Institutionen för svenska språkets webbsida