Skip to main content

News archive

Teknik som analyserar texters svårighetsgrad kan förbättra språkinlärningen

Tekniska verktyg kan på olika sätt bidra till en effektivare språkinlärningsprocess. I en ny avhandling av Ildikó Pilán, doktorand vid Göteborgs universitet och Språkbanken, presenteras en metod för automatisk analys av den språkliga komplexiteten i svenska texter. Det ger pedagoger en möjlighet att kunna hitta läromaterial med precis rätt svårighetsgrad för elever i svenska som andraspråk.

Läs mer på institutionen för svenska språkets webbsida.

Avhandlingen Automatic proficiency level prediction for Intelligent Computer-Assisted Language Learning försvaras vid en disputation den 14 juni, klockan 13.15 i Stora Hörsalen (2150), Eklandagatan 86 i Göteborg.

Svenskt kvinnobiografiskt lexikon (SKBL) fritt tillgängligt på nätet

Den 8 mars, på internationella kvinnodagen, lanserades Svenskt kvinnobiografiskt lexikon (SKBL) och finns nu fritt tillgängligt på nätet. I lexikonet biograferas kvinnor som under olika tider och på varierande sätt har bidragit till samhällsutvecklingen, såväl lokalt som nationellt och internationellt. Lexikonet gör kvinnorna i historien väl synliga och lätta att hitta.

SKBL har producerats vid Göteborgs universitet. Artiklarna har skrivits av specialister och forskare verksamma vid olika lärosäten och andra kulturinstitutioner i hela Sverige. Arbetet har finansierats av Riksbankens Jubileumsfond. Databasen har utvecklats av Språkbanken och den förvaltas av SWE-CLARIN.

Lexikonet är tillgängligt för alla både på svenska och engelska på www.skbl.se.

Språkbanken blir nationell

Språkbanken har tilldelats sammanlagt 210 miljoner kronor för att under 7 år vidareutveckla sin verksamhet i en ny nationell forskningsinfrastruktur för forskning i språkteknologi och språkvetenskap samt andra ämnesområden som bedriver forskning baserad på språkliga data.
– Samtidigt omvandlas vi till ett konsortium med tre huvudparter, där Göteborgs universitet blir samordnare, förklarar föreståndaren Lars Borin.

Konsortiet består av Språkbanken vid GU, Talteknologi vid KTH samt Språkrådet (Institutet för språk och folkminnen). Även SWE-CLARIN, som tillgängliggör språkteknologiska verktyg inom främst humaniora och samhällsvetenskap, ingår som en mindre del, där ytterligare sju universitet och myndigheter medverkar.
– Göteborgs universitet, som har forskat om språkteknologi i ett halvsekel, är främst bland svenska lärosäten inom området, förklarar Lars Borin, professor i språkvetenskaplig databehandling. Det är alltså ingen slump att det är vi som fått uppdraget att leda konsortiet.

Konsortiet är unikt på så sätt att det även kommer att hantera samhällspolitiska hänsynstaganden om vad Sverige vill med sin språkpolitik.

– Språkrådet påpekar att mycket av det vi gör nu, exempelvis om vi accepterar att viss information bara finns på engelska, kommer att påverka svenska språkets funktion i vår digitala samtid. Samverkan med KTH kommer bland annat att handla om att hitta en närmare koppling mellan skrift och tal samt om forskning på språk i olika medier.

– En väsentlig del av all information som produceras i samhället förmedlas ju i text eller tal, påpekar Lars Borin. Ett exempel på material som går att undersöka med så kallad data mining är medicinska journaler. Genom att gå igenom kanske 10 000 journaler kan en forskare upptäcka nya saker som inte uppmärksammats tidigare, som att en viss biverkan hänger samman med ett visst preparat. För att den här typen av undersökningar ska fungera är det förstås viktigt att ha verktyg som förstår texter på svenska. Språkbankens budget kommer nu att bli hela tre gånger så stor, vilket visar att Vetenskapsrådet verkligen insett betydelsen av att svensk språkteknologi håller fortsatt hög nivå.

Språkbanken – ett certifierat B–center

Språkbanken har blivit ett av CLARIN ERIC:s tjugotalet certifierade så kallade B-centra (Service Providing Centres). B-centra är särskilt väletablerade forsknings- och utvecklingsmiljöer i Europa, som utgör ryggraden i CLARIN (jämför B-förkortningen med engelskans ”backbone”). För att bli certifierad som ett B-center krävs att en rad stränga kvalitetskriterier uppfylls. CLARIN:s B-centra tillhandahåller långsiktiga resurser, tjänster och kunskaper utifrån en stabil teknisk och institutionell grund.

CLARIN är organiserat som ett konsortium och strukturen är uppbyggd kring ett antal centra.

Förutom B-centra finns bland annat A-centra (infrastrukturcentra) och K-centra (kunskapscentra). De sistnämnda är i majoritet och svarar bland annat för att skapa, uppgradera och underhålla digitala språkresurser utifrån specialistkompetens.

Nytt projekt undersöker uppkomsten av komplexa verbkonstruktioner i germanska språk

Text in English, please see below.

Vad?
Projektet undersöker uppkomsten av komplexa verbkonstruktioner i germanska språk. De moderna germanska språken är kända för att (på olika sätt) stapla hjälpverb i långa verbkonstruktioner, se exempel (1).

(1) I have been able to come.
Ik heb kunnen komen.
Ich habe kommen können.
Jag har kunnat komma.

Vi vet väldigt lite om varför och hur sådana komplexa verbkonstruktioner har kommit till. Syftet med det här projektet är därför att kartlägga språkförändringarna som har lett till den moderna variationen.

Varför?
Projektet utforskar hur och varför språkliga konstruktioner kan bli längre och mer komplicerade i språkets utveckling, en process som vi kallar för ’konstruktionell komplexifiering’. Komplexifiering är inte begränsad till uppkomsten av komplexa verbkonstruktioner utan dyker även upp i andra områden av språkets konstruktionella nätverk. Processen har också en rumslig dimension som överskrider språkgränserna.

Hur?
Projektet undersöker verbkonstruktionernas historia med hjälp av tre (komplementära) metoder: kvalitativ studie av historiska grammatikböcker, kvantitativ korpusstudie av språkspecifika historiska korpusar, kvantitativ korpusstudie av en diakron parallellkorpus.

Parallellkorpusar har hittills inte används inom historisk lingvistik. Projektet kommer därför att sammanställa en parallellkorpus bestående av historiska bibelöversättningar på engelska, nederländska och tyska.

Medverkande parter i projektet är:
Evie Coussé, Göteborgs universitet, Inst. för språk och litteraturer (huvudsökande)
Nicoline Van der Sijs, Radboud universitet Nijmegen
Gerlof Bouma, Språkbanken

Projektet bedrivs med stöd från Vetenskapsrådet hösten 2018 – 2021.

New project investigates the rise of complex verb constructions in Germanic

What?
This project investigates the rise of complex verb constructions in Germanic. Complex verb constructions (also known as ‘long verb clusters’) combine two or more auxiliaries with a main verb, as illustrated in (1).

(1) I have been able to come.
Ik heb kunnen komen.
Ich habe kommen können.
Jag har kunnat komma.

Little is known on why and how such complex verb constructions came into being. This project aims to uncover the pathways of change that have led to the current diversity in Germanic.

Why?
The project contributes to our understanding of how and why (some) constructions become longer and more complex in langauge change, a process we call ‘constructional complexification’. Complexification is not limited to the rise of complex verb constructions but surfaces in several other areas of the constructional network. It also has an areal dimension that goes beyond the confines of one particular language in Germanic.

How?
The project studies the history of verb constructions by means of three (complementary) methods: qualitative survey of historical reference grammars, quantitative corpus study using language-specific historical corpora, quantitative corpus study of a diachronic parallel corpus.

Parallel corpora have not been used before in historical linguistics. This project therefore includes the compilation of a parallel corpus based on historical Bible translations in English, Dutch and German.

Project partners:
Evie Coussé, University of Gothenburg, Department of Languages & Literatures (principal investigator)
Nicoline Van der Sijs, Radboud University Nijmegen
Gerlof Bouma, Språkbanken

The project is funded by Vetenskapsrådet Autumn 2018 – 2021.

New project aims to enhance access to the world’s linguistic heritage

The Dictionary/Grammar Reading Machine: Computational Tools for Accessing the World’s Linguistic Heritage (DReaM).

The diversity of the world's 6,500 languages embodies a wealth of information on human cognition and the history of populations. As languages go extinct, the linguistic heritage of human kind increasingly resides in grammars and dictionaries, which are rapidly accumulating. Accessing this heritage entails that the descriptions are available and that they are read by someone. Availability is a problem because publications are often difficult to access.

In this project we aim to enhance access to the world’s linguistic heritage by making an existing collection of more than 9,000 PDF documents no longer protected by to copy-right available in a stable archive enriched by added metadata and computational tools developed to search information within the texts. Moreover, a number of dictionaries will be converted to apps for mobile devices that can be distributed to speakers of minority languages, handing back to these speakers some of their linguistic heritage. The developed resources, particularly grammatical descriptions, are to be used for experimentation and development of methodologies for automatic extraction of linguistic features.

The project is funded by the European Union's Horizon 2020 research and innovation programme under grant agreement No 6995327 and lasts between 2018-02-01 - 2020-12-31.

Project partners:

  • Uppsala University, Department of Linguistics and Philology, Sweden
  • Språkbanken, Department of Swedish, University of Gothenburg, Sweden
  • Leiden University Centre for Linguistics (LUCL), Netherlands
  • Centre National de la Recherche Scientifique Langage, Langues et Cultures d'Afrique Noire (LLACAN), France

For more information, please visit: http://stp.lingfil.uu.se/~harald/dream.html