Jag är föreståndare för Nationella språkbanken, nationell koordinator för Swe-Clarin och professor i ämnet språkvetenskaplig databehandling, som faller under det vidare forskningsområdet språkteknologi. Språkteknologi omfattar många olika forskningsinriktningar. Det har en uppenbart praktisk aspekt, där man utforskar och utvecklar metoder för att få datorer att uppvisa ”mänskligt” språkligt beteende, t.ex. textförståelse för storskalig dokumenthantering och informationssökning, automatisk översättning och automatisk omvandling av tal till text och vice versa. Språkteknologi har även en mer teoretisk sida, där man med datorns hjälp belyser egenskaper hos människans språk som generellt fenomen, både i avsikt att bidra till den språkvetenskapliga forskningen – ett av mina centrala forskningsintressen – och för att de kunskaper man vinner ska föras tillbaka så att man kan bygga alltmer sofistikerade språkhanterande datorsystem.
En ökande användning för såna system är som forskningsstöd i forskningsämnen där sakinnehållet i text (och tal) utgör centrala forskningsdata, en rik källa till information om historia, samhälle, politik, etc. Idag produceras enorma mängder digital text och de historiska texter som utgör en betydande och viktig del av vårt kulturarv digitaliseras i rask takt. Språkteknologi kan hjälpa forskarna att utnyttja detta jättelika material – miljardtals ord bara på svenska – genom att utveckla effektiva verktyg för digital humanistisk och samhällsvetenskaplig forskning. Detta är också ett viktigt fokus i min forskning, och särskilt de metodologiska frågor som uppstår i spänningsfältet mellan traditionella ”närläsande”, kvalitativa metoder och storskaliga kvantitativa metoder.
Utvecklingen av högpresterande språkanalyssystem fordrar tillgång till vad man brukar kalla språkresurser, både stora mängder relevant text och databaser med högvärdig lingvistisk information, t.ex. rikt strukturerade lexikon. Därför handlar en annan central del av min forskning om att utveckla och på bästa sätt utnyttja språkresurser för alla moderna och historiska former av skriven svenska.
Forskningsintressen
språkteknologiinfrastruktur, digitala språkresurser, e-vetenskap, forskningsmetodologi, digital historisk lingvistik, lexikografi, ordsemantik, språktypologi, digital humaniora, datorstödd språkinlärning, flerordsuttryck
Anställningar och uppdrag
- Professor i språkvetenskaplig databehandling, institutionen för svenska språket, Göteborgs universitet
- Föreståndare för Nationella språkbanken
- Nationell koordinator för SWE-CLARIN
Organisationer och samarbeten
- Litteraturbanken
- Menota (Arkiv för nordiska medeltidstexter)
- NEALT SIG-Infra
- NEALT SIG-ICALL
- ACL SIGLEX
Annat
- Arrangör: SLTC (Swedish Language Technology Conference) 2006 (med Martin Volk), Göteborg
- Lokal arrangör: EACL 2014 (med Aarne Ranta), Göteborg
- Programkommittéordförande: CLARIN 2016, Aix-en-Provence