Menu

News

Page 1
UPDATED DEADLINE: the deadline for submission has been extended to May 3rd, 23:59 AoE.

Språkbanken Text, and the project Towards Computational Lexical Semantic Change Detection are organizing a second LChange workshop on Computational Approaches to Historical Language Change in August, 2021.

The workshop builds upon its first iteration in 2019, where we received over 50 submissions and had over 65 attendees. Just like the first one, the second LChange workshop will be co-located with ACL (2021).

The call for papers will be similar to last time: all aspects around computational approaches to historical language change with the focus on digital text corpora.  

Like LChange'19, this edition will host two keynotes.

We are looking forward to your submission and participation!

More information on: https://languagechange.org/events/2021-acl-lchange/

Sparv logo
Nu finns det en ny version av Språkbankens textanalysverktyg Sparv. En ny funktion som har tillkommit i denna version är den så kallade preloadern.

Den nya preloadern i Sparv snabbar upp annoteringsprocessen om man annoterar många små filer. Utöver det har vi fixat många buggar samt jobbat på att förbättra användarupplevelsen, t.ex. genom att ge bättre återkoppling när någonting går snett och genom att förtydliga dokumentationen. För en komplett översikt över alla nya funktioner, förbättringar och buggfixar, se changeloggen här.

All information om hur man installerar och använder Sparv finns på https://spraakbanken.gu.se/sparv.

This blog is based on a joint work by Elena Volodina, Therese Lindström Tiedemann and Yousuf Ali Mohammed within the RJ-funded project L2 profiles.

Three annotators have contributed to this work: Stellan Petersson (University of Gothenburg), Beatrice Silén (Helsinki university) and Maisa Lauriala (Helsinki university). Do you know how many prefixes or suffixes Swedish language has? Which ones? Different sources state different numbers, e.g Thorell (1984) lists approx. 90 derivational suffixes and about 50 derivatonal prefixes; Hultman (2003) names 200 derivationa affixes …
Fortsätt läsa ”Swedish derivational morphology with CoDeRooMor”

Till Språkbanksbloggen
Hör du till dem som råkat ut för en självutnämnd hobbyepidemiolog? Eller har du kanske drabbats av zoombombning eller sökt coronapass? Dimitrios Kokkinakis är docent i språkteknologi vid Språkbanken Text. Tillsammans med några av sina kollegor är han i full färd med att undersöka vilka nya ord och uttryck som den pågående pandemin gett upphov till och hur de används i olika kontexter.

Projektet startade ganska nyligen, och syftet är bland annat att undersöka hur äldre benämns och begreppsliggöras i olika texter, förklarar Dimitrios Kokkinakis, forskare vid Språkbanken men även knuten till Centrum för åldrande och hälsa (AgeCap).

– De texter vi samlar material från är nyhetsmedier, myndigheter samt en del vetenskaplig text, som i allmänhet håller en ganska neutral ton. Mina kollegor samlar in bloggar, Twitter och texter från andra sociala medier och där kan språket förstås bli lite vildare. Vi har inte hunnit analysera materialet än men hoppas göra en djupare sammanställning någon gång under våren. 

Läs hela nyheten på gu.se >>

Blogginlägg om korpusen >>
 

 

Dimitrios Kokkinakis, docent i språkvetenskaplig databehandling vid Språkbanken Text, Göteborgs universitet, belönas med Albert Wallins vetenskapspris 2020. Kungliga Vetenskaps- och Vitterhetssamhället (KVVS) i Göteborg står bakom priset som delas ut en gång per år. – Jag blev lite tagen när jag fick reda på det, det här hade jag inte räknat med, säger Dimitrios Kokkinakis.

Läs hela nyheten på gu.se

FAKTA
Kungliga Vetenskaps- och Vitterhets-Samhället
Grundades under 1700-talet för att främja vetenskap och vitterhet genom, exempelvis utdelning av stipendier till personer för vetenskaplig forskning och annat stöd till olika verksamhetsområden som sker via medel från Kungliga Vetenskaps- och Vitterhets-Samhällets egna fonder och stiftelser samt från Adlerbertska forskningsstiftelsen.

Albert Wallin
Albert Wallin var överläkare på Ekmanska sjukhuset i Göteborg. Han donerade vid några tillfällen pengar till KVVS i början av 1950-talet. En del av dessa medel avsattes till en fond som används för ett årligt pris som delades ut för första gången redan 1957.

Den 28 januari lanseras Litteraturkartan.se, en digital karta för att utforska litteratur i Bohuslän, Dalsland och Västergötland. Lanseringen livesänds från Göteborgs Litteraturhus och bakom den tekniska utvecklingen står Johan Roxendal på Språkbanken Text vid Göteborgs universitet.

Läs hela nyheten på Institutionen för svenska språkets webbplats.

FAKTA
Litteraturkartan.se har tagits fram av Litteraturbanken.se, med Johan Roxendal på Språkbanken Text vid Göteborgs universitet som utvecklare, och med finansiellt stöd av Västra Götalandsregionen, VGR. Även Förvaltningen för Kulturutveckling har varit delaktig i projektet.

NoDaLiDa workshop, Online, May 31 2021

For further information, see the workshop website <https://spraakbanken.gu.se/en/research/themes/icall/nlp4call-workshop-series/nlp4call2021>

The NLP4CALL workshop is co-located with NoDaLiDa 2021.
Just like the main conference, the workshop will be organized as an online event.

 

Description of the workshop
The workshop series on Natural Language Processing (NLP) for Computer-Assisted Language Learning (NLP4CALL) is a meeting place for researchers working on the integration of Natural Language Processing and Speech Technologies in CALL systems and exploring the theoretical and methodological issues arising in this connection. The latter includes, among others, insights from Second Language Acquisition (SLA) research, on the one hand, and promote development of “Computational SLA” through setting up Second Language research infrastructure(s), on the other.

The intersection of Natural Language Processing (or Language Technology / Computational Linguistics) and Speech Technology with Computer-Assisted Language Learning (CALL) brings “understanding” of language to CALL tools, thus making CALL intelligent. This fact has given the name for this area of research – Intelligent CALL, ICALL. As the definition suggests, apart from having excellent knowledge of Natural Language Processing and/or Speech Technology, ICALL researchers need good insights into second language acquisition theories and practices, as well as knowledge of second language pedagogy and didactics. This workshop invites therefore a wide range of ICALL-relevant research, including studies where NLP-enriched tools are used for testing SLA and pedagogical theories, and vice versa, where SLA theories, pedagogical practices or empirical data are modeled in ICALL tools.

The NLP4CALL workshop series is aimed at bringing together competences from these areas for sharing experiences and brainstorming around the future of the field.

Important dates
13 January: first call for papers
8 February: second call for papers
1 March: third call for papers
11 March: final call for papers
26 March: paper submission deadline and deadline for expression of interest for research notes
19 April: notification of acceptance (regular papers)
27 April: notification of acceptance (research notes)
6 May: camera-ready deadline
31 May: workshop date

Workshop website <https://spraakbanken.gu.se/en/research/themes/icall/nlp4call-workshop-series/nlp4call2021>

Nu finns en ny version av textanalysverktyget Sparv. Sparv märker upp texter med lingvistisk information och är ett av många språkteknologiska verktyg som utvecklats inom Nationella språkbanken.

Läs hela nyheten på språkbanken.se

As the COVID-19 virus became a pandemic in March 2020, the amount of (time-stamped written) data, such as news/newspaper reports, scientific articles, social media posts (e.g. blogs and twitter), surveys and other information about the virus and its symptoms, prevention, management and transmission became massively available.

Such data contained both valid and reliable information, and relevant facts from trusted sources and also rumors, conspiracy theories and misinformation from unofficial ones. However, it was not only the amount of (written) data and information …

Continue reading ”A Swedish COVID-19 (sv-COVID-19) corpus and its exploration … smorgasbord”

Språkbanksbloggen
Artificial intelligence system dealing with (human) natural language rely on language models, predictions of which words occur together.

To better understand how such models work — and where they fail — when applied to Swedish texts we need Swedish test data. A collection of test data addressing various aspects of understanding and generating text allows us to evaluate and compare models. During the autumn of 2020 we have started working on developing evaluation data for Swedish language models at Språkbanken Text. This …
Fortsätt läsa ”The SwedishGLUE project”

Till Språkbanksbloggen
Page 1