Meny

Nyheter

Sida 1
Under vinjetten ”Månadens profil” på språkbanken.se presenteras personer vars arbete har anknytning till Nationella språkbanken. Först ut är Lena Wenner, forskare och dialektolog på Isof, som bland annat jobbar med Dialektkartan, ett verktyg där det går att söka bland och lyssna på inspelningar från Isofs samlingar.

Läs intervjun med Lena på språkbanken.se

Dimitrios Kokkinakis, docent i språkvetenskaplig databehandling vid Språkbanken Text, Göteborgs universitet, belönas med Albert Wallins vetenskapspris 2020. Kungliga Vetenskaps- och Vitterhetssamhället (KVVS) i Göteborg står bakom priset som delas ut en gång per år. – Jag blev lite tagen när jag fick reda på det, det här hade jag inte räknat med, säger Dimitrios Kokkinakis.

Läs hela nyheten på gu.se

FAKTA
Kungliga Vetenskaps- och Vitterhets-Samhället
Grundades under 1700-talet för att främja vetenskap och vitterhet genom, exempelvis utdelning av stipendier till personer för vetenskaplig forskning och annat stöd till olika verksamhetsområden som sker via medel från Kungliga Vetenskaps- och Vitterhets-Samhällets egna fonder och stiftelser samt från Adlerbertska forskningsstiftelsen.

Albert Wallin
Albert Wallin var överläkare på Ekmanska sjukhuset i Göteborg. Han donerade vid några tillfällen pengar till KVVS i början av 1950-talet. En del av dessa medel avsattes till en fond som används för ett årligt pris som delades ut för första gången redan 1957.

Den 28 januari lanseras Litteraturkartan.se, en digital karta för att utforska litteratur i Bohuslän, Dalsland och Västergötland. Lanseringen livesänds från Göteborgs Litteraturhus och bakom den tekniska utvecklingen står Johan Roxendal på Språkbanken Text vid Göteborgs universitet.

Läs hela nyheten på Institutionen för svenska språkets webbplats.

FAKTA
Litteraturkartan.se har tagits fram av Litteraturbanken.se, med Johan Roxendal på Språkbanken Text vid Göteborgs universitet som utvecklare, och med finansiellt stöd av Västra Götalandsregionen, VGR. Även Förvaltningen för Kulturutveckling har varit delaktig i projektet.

NoDaLiDa workshop, Online, May 31 2021

For further information, see the workshop website <https://spraakbanken.gu.se/en/research/themes/icall/nlp4call-workshop-series/nlp4call2021>

The NLP4CALL workshop is co-located with NoDaLiDa 2021.
Just like the main conference, the workshop will be organized as an online event.

 

Description of the workshop
The workshop series on Natural Language Processing (NLP) for Computer-Assisted Language Learning (NLP4CALL) is a meeting place for researchers working on the integration of Natural Language Processing and Speech Technologies in CALL systems and exploring the theoretical and methodological issues arising in this connection. The latter includes, among others, insights from Second Language Acquisition (SLA) research, on the one hand, and promote development of “Computational SLA” through setting up Second Language research infrastructure(s), on the other.

The intersection of Natural Language Processing (or Language Technology / Computational Linguistics) and Speech Technology with Computer-Assisted Language Learning (CALL) brings “understanding” of language to CALL tools, thus making CALL intelligent. This fact has given the name for this area of research – Intelligent CALL, ICALL. As the definition suggests, apart from having excellent knowledge of Natural Language Processing and/or Speech Technology, ICALL researchers need good insights into second language acquisition theories and practices, as well as knowledge of second language pedagogy and didactics. This workshop invites therefore a wide range of ICALL-relevant research, including studies where NLP-enriched tools are used for testing SLA and pedagogical theories, and vice versa, where SLA theories, pedagogical practices or empirical data are modeled in ICALL tools.

The NLP4CALL workshop series is aimed at bringing together competences from these areas for sharing experiences and brainstorming around the future of the field.

Important dates
13 January: first call for papers
8 February: second call for papers
1 March: third call for papers
11 March: final call for papers
18 March: paper submission deadline (long, short and demo, research notes)
19 April: notification of acceptance (regular papers)
27 April: notification of acceptance (research notes)
6 May: camera-ready deadline
31 May: workshop date

Workshop website <https://spraakbanken.gu.se/en/research/themes/icall/nlp4call-workshop-series/nlp4call2021>

Nu finns en ny version av textanalysverktyget Sparv. Sparv märker upp texter med lingvistisk information och är ett av många språkteknologiska verktyg som utvecklats inom Nationella språkbanken.

Läs hela nyheten på språkbanken.se

As the COVID-19 virus became a pandemic in March 2020, the amount of (time-stamped written) data, such as news/newspaper reports, scientific articles, social media posts (e.g. blogs and twitter), surveys and other information about the virus and its symptoms, prevention, management and transmission became massively available.

Such data contained both valid and reliable information, and relevant facts from trusted sources and also rumors, conspiracy theories and misinformation from unofficial ones. However, it was not only the amount of (written) data and information …

Continue reading ”A Swedish COVID-19 (sv-COVID-19) corpus and its exploration … smorgasbord”

Språkbanksbloggen
Artificial intelligence system dealing with (human) natural language rely on language models, predictions of which words occur together.

To better understand how such models work — and where they fail — when applied to Swedish texts we need Swedish test data. A collection of test data addressing various aspects of understanding and generating text allows us to evaluate and compare models. During the autumn of 2020 we have started working on developing evaluation data for Swedish language models at Språkbanken Text. This …
Fortsätt läsa ”The SwedishGLUE project”

Till Språkbanksbloggen
25-27 november gick den åttonde upplagan av SLTC, Swedish Language Technology Conference, av stapeln på Humanisten här i Göteborg.

Eller, skulle ha gjort om inte ett visst virus satte stopp för det. Istället fick vi som alla andra ställa om till en helt digital utgåva, men det funkade det med. Vi fick ett rekord i antalet registreringar: 193 deltagare från 34 olika länder! (Majoriteten, 60%, kom dock från Sverige). Inte alla dök förstås upp – dels var registreringen gratis, och dels var …
Fortsätt läsa ”Reflektioner från SLTC 2020”

Till Språkbanksbloggen
We at Språkbanken Text have just released a new corpus of native (L1) and non-native (L2) speech in four languages: English, Spanish, French and Italian.

The corpus contains more than 170 million words produced by more than 97 thousand speakers (size varies a lot across the four languages, though). The corpus has been created by scraping WordReference forums, where users discuss various questions about languages. Importantly, every user has to provide their native language, and this information, alongside with the nickname, is …
Fortsätt läsa ”How native and non-native speakers talk to each other”

Till Språkbanksbloggen
Sida 1