Meny

Alla nyheter

Sida 1
Gloria Gagliardi (universitetet i Bologna, Italien), Dimitrios Kokkinakis (Göteborgs universitet) och Jon Andoni Dunabeitia (universitetet i Nebrija, Spanien och Norges arktiska universitet) har varit gästredaktörer för ett specialnummer av den i ansedda tidskriften Frontiers med tema ”Digital Linguistic Biomarkers: Beyond Paper and Pencil Tests". 

Länk till artikeln “Digital Linguistic Biomarkers: beyond paper and pencil tests”: https://www.frontiersin.org/articles/10.3389/fpsyg.2021.752238/full

Deltagande tidskrifter: Frontiers in Psychology, Frontiers in Neuropsychology, Frontiers in Human Neuroscience, Frontiers in Digital Health and Frontiers in Communication.

Those interested in astronomy may have noticed that Jupiter is currently in opposition.

But what does that mean? And what does ”Jupiter” mean? And what does all of this have to do with corpus linguistics, Elizabeth Taylor, and Tuesdays?

Till Språkbanksbloggen
Nu kan du som talar svenska som andraspråk eller du som är lärare/forskare/bedömare/kursboksförfattare inom svenska som andraspråk hjälpa till att ta reda på detta.

Som ett delprojekt i projektet Utveckling av lexikala och grammatiska kompetenser i invandrarsvenska (L2P) vill man se om andraspråkstalares intuitioner om ordens svårighetsgrad motsvarar lärares/forskares bedömning. 

Testet går ut på att jämföra grupper av fyra ord, och välja vilket som är det lättaste ordet att förstå, och vilket som är det svåraste ordet bland dessa fyra alternativ. Det finns inget rätt eller fel svar och det är bäst att försöka svara fort, inom 30 sekunder/uppgift. Mer information finns i guidelines. Experimentet är öppet till den 5 oktober 2021.

Guidelines

Fyll i samtycke och gör testet

 

Ansvariga forskare och deltagande universitet:
Göteborgs universitet, Sverige: Elena Volodina 
Helsingfors universitet, Finland: Therese Lindström Tiedemann
Université catholique de Louvain, Belgien: David Alfter 

 

Sök en doktorandtjänst hos oss.

Sista ansökningsdag: 2021-10-01

Läs mer på sökandeportalen >>

Boken har elva kapitel, varav en stor översiktsartikel som täcker olika typer av metoder och utvärderingsmodeller för semantiska språkförändringar. Boken är ett resultat av LChange'19, en bredare internationella workshop på ämnet automatiska metoder för alla typer av språkförändringar som kan hitta med hjälp av texter. Bland författarna finns bland annat Nina Tahmasebi, Lars Borin och Simon Hengchen från Språkbanken Text.

Samtliga kapitel finns att ladda ner gratis på
https://langsci-press.org/catalog/book/303
 

Dana Dannélls är forskare i språkteknologi på Språkbanken Text. Hon jobbar bland annat med att utveckla, förbättra och utvärdera språkteknologiska verktyg och resurser för att göra dem tillgängliga för språkteknologiska applikationer men också för forskare och den intresserade allmänheten.

Just nu ägnar Dana en stor det av sin tid åt ett projekt som heter Utvärdering och anpassning av en förbättrad OCR-process vid massdigitalisering. Det är ett samarbetsprojekt mellan Språkbanken Text och Kungliga biblioteket, KB, som handlar om att förbättra processen vid massdigitalisering av text. 

Läs hela intervjun med Dana på språkbanken.se

Under vinjetten Månadens profil på språkbanken.se presenteras personer vars arbete har anknytning till Nationella språkbanken.

Den 26 augusti lanseras en ny digital textsamling där Språkbanken Text vid Göteborgs universitet tillgängliggör cirka 1000 studentuppsatser. Uppsatserna är skrivna av studenter med ett annat modersmål än svenska och samlingen gör det möjligt att studera andraspråksutveckling på nya och enklare sätt.

Textsamlingen, den så kallade korpusen, har sammanställts i projektet SweLL – Swedish Learner Language som har engagerat forskare från universiteten i Göteborg, Stockholm, Umeå och Uppsala. Elena Volodina, forskare i Språkteknologi på Språkbanken Text vid Göteborgs universitet, har lett arbetet:

– Det har varit ett omfattande arbete att bygga korpusen och infrastrukturen för den manuella annoteringen, och vi har gjort långt mer än vad planerade. Nu ser jag fram emot att samlingen blir offentlig och kommer till användning!

Läs hela nyheten på gu.se >>

Programmet för lanseringen av SweLL

Anmäl dig till lanseringen av SweLL

Läs mer om projektet

I förra blogginlägget fick vi läsa om korsord, en populär sysselsättning så här under sommarmånaderna.

En relaterad hobby om man vill vara lite mer social är förstås att spela Scrabble – även känt under det svenska namnet Alfapet, samt i olika digitala versioner, bland annat Wordfeud. För den som mot förmodan inte känner till spelet går det ut på att lägga ut bokstäver för att forma ord på en spelplan i ett korsordsliknande rutmönster. Olika bokstäver ger olika poäng, och vissa rutor …
Fortsätt läsa ”Vilket ord är bäst?”

Till Språkbanksbloggen
Nu släpper Språkbanken Text SuperLim 1.0, en datasamling som kan användas för testning och utvärdering av svenska språkmodeller. Släppet är en del i projektet SuperLim, ett samarbete med aktörer inom språkteknologi och artificiell intelligens.

Det saknades länge stora språkmodeller för svenska. Nyligen har dock flera språkmodeller utvecklats, bland annat av KB-labb, och fler är under utveckling där och på annat håll. Modellerna tränas på stora mängder text för att kunna analysera och strukturera texter och förstå språk. Modellerna kan till exempel sammanfatta texter, mäta hur lika de är eller göra analys av vilken attityd som uttrycks i delar av texten. Språkmodeller kan förbättra alla typer av språkteknologiska tillämpningar för svenska texter och vara till användning både inom forskningen och den privata och offentliga sektorn. 

–  Det är jättebra att vi äntligen har språkmodeller på svenska, däremot är det svårt att utvärdera dem. Därför har vi tagit fram en samling med tretton utvärderingsmängder som vi kallar SuperLim. Alla aktörer kan använda samlingen för att testa modellerna och se hur bra de är på att förstå språket, berättar Aleksandrs Berdicevskis som är forskare på Språkbanken Text och en av deltagarna i projektet.

Projektet är ett samarbete mellan Språkbanken Text, KB-labb, forskningsinstitutet RISE och AI Sweden och använder en strategi för utvärdering som delvis följer den engelska förlagan (Super)Glue.

En viktig del i utvärderingen är att ta reda på om modellerna har statistiska skevheter, exempelvis att modellerna kodar in fördomar, för att i så fall kunna hantera dem på lämpligt sätt.

–  Tidigare studier visar att språkmodellerna är känsliga för vilken data de tränas på och de speglar ofta de fördomar som vi människor har och som funnits med i träningsdata. Det kan till exempel handla om rasistiska fördomar eller att en språkmodell antar att en läkare är en man och en sjuksköterska är en kvinna. Det är viktigt att utvärdera och förbättra språkmodellerna så att vi kan motverka de fördomar som blir inbyggda i modellerna, säger projektdeltagaren Yvonne Adesam, Språkbanken Text.

Läs mer på projektsidan >>

Datasamlingen SuperLim 1.0 >>

Sida 1