Skip to main content

Research

Språkbanken's research unit develops state-of-the-art language technology and pursues theoretical and practical aims within different research areas. Our research focuses both on language technology itself (creating comprehensive, high-quality resources that are needed to develop tools and algorithms) and on questions from other disciplines.
2026 - 2029
This project investigates speech and language as early markers of cognitive decline by integrating linguistic analysis with neuropsychological tests and biomarkers. Using large-scale, clinically validated datasets and state-of-the-art AI methods, it aims to identify, combine, and track linguistic, cognitive, and behavioral indicators to improve early diagnosis, monitoring, and prognosis of dementia.
  • Dimitrios Kokkinakis
  • Charalambos Themistocleous
  • Lina Rydén
  • Johan Skoog
  • cognitive decline
  • linguistic biomarkers
  • language disorders
  • neuropsychological tests
2026 - 2028
Historisk levnadsstandard är ett centralt forskningsfält inom ämnet ekonomisk historia. I detta forskningsfält har förslavade individer ofta osynliggjorts på grund av att de saknas i de källor som vanligen används. Detta projekt ska studera hur förslavade människor i 1800-talets USA beskrev sin levnadsstandard, baserat på en stor mängd ”slavnarrativ” – självbiografiska texter av, eller intervjuer med, före detta förslavade människor. Tidigare forskning uppskattar att det finns cirka 5 000 sådana berättelser från USA i olika arkivsamlingar. Berättelserna kommer att samlas i en annoterad textkorpus. Den annoterade textkorpusen kommer så småningom att göras fritt tillgänglig för vidare forskning, för att kunna användas för såväl historisk som språkvetenskaplig eller annan forskning. När korpusen har tagit form, kommer vi att studera hur dessa individer beskrev både sin materiella levnadsstandard (i form av ägande av materiella saker) och sina icke-materiella livsvillkor (med fokus på det trauma som slaveriets våld och tvång innebar). Textanalysen kommer att omfatta både datorstödd analys och forskardriven, korpusbaserad diskursanalys av berättelserna. Detta tillvägagångssätt möjliggör en större helhetsbild av de förslavades många olika röster än vad tidigare (huvudsakligen anekdotisk) forskning på området har kunnat ge. Vi kommer att analysera om dessa två aspekter varierade med avseende på sociala, kulturella och geografiska faktorer, samt om de förändrades över tid – framförallt i och med att individerna befriade sig själva eller blev befriade från slaveriet. Projektet genomförs av Klas Rönnbäck (ekonomisk historia), Irene Elmerot (korpuslingvistisk diskursanalys) och Leif-Jöran Olsson (språkteknologi), i samarbete med Morgan State University i USA och en bred internationell referensgrupp med framstående forskare från olika forskningsämnen.
  • Leif-Jöran Olsson
  • Klas Rönnbäck
  • Irene Elmerot
  • Economic History
  • digital humanities
  • Corpus-Assisted Discourse Studies
  • computational linguistics
  • historiskt material
  • kulturarv
2022 - 2028
HUMINFRA  är en ny distribuerad, nationell infrastruktur för forskning inom humaniora, konst och samhällsvetenskap.
  • Gerlof Bouma
  • Dana Dannélls
  • Markus Forsberg
  • Dimitrios Kokkinakis
  • Elena Volodina
2025 - 2028
Increased social stratification is associated with societal problems, most clearly in the Global South. Research on the origins of high social stratification has therefore grown, but empirical and methodological challenges complicate the work. Our project aims to investigate the origins of the high social stratification in Argentina (1850–1900), once a wealthy country but now afflicted by crises and inequality – commonly referred to as the “Argentine paradox.” We plan to use advanced OCR technology to digitize a rich body of source material at the individual level. By examining measures of occupational structure, literacy, and social mobility, we will provide new insights into the historical origins of the “Argentine paradox.”
  • Stefania Galli
  • Dana Dannélls
  • Juliá Ciarelli, Juan Pablo
  • digital humanities
  • historiskt material
  • multilingual
  • Economic History
2023 - 2028
Accessibility of research data is critical for advances in many research fields, but textual data often cannot be shared due to the presence of personal and sensitive information, e.g names, political opinions. GDPR suggests pseudonymization as a solution, but we need to learn more about it before adopting it for manipulation of research data.
  • Elena Volodina
  • Simon Dobnik
  • Xuan-Son Vu
  • Therese Lindström Tiedemann
  • Maria Irena Szawerna
  • Lisa Södergård
  • pseudonymization
  • research data
  • språkteknologi
  • allmän lingvistik
  • svenska som andraspråk
  • pseudonymisering
  • dataintegritet
  • forskningsdata
2021 - 2028
Inom ramarna för projektet förvaltas och vidareutvecklas Svenska Akademiens lexikala databas (Salex). Vidare bedrivs arbete med Svenska Akademiens båda samtidsordböcker Svenska Akademiens ordlista (SAOL) och Svensk ordbok utgiven av Svenska Akademien (SO). Arbetet sker på uppdrag av och i samarbete med Svenska Akademien.
  • Kristian Blensenius
  • Markus Forsberg
  • Louise Holmer
  • Hans Landqvist
  • Stellan Petersson
  • Emma Sköldberg
  • Jonatan Uppström
  • Ann Lillieström
2020 - 2028
A joint project between Språkbanken Text, FLoV and CLASP, with the purpose of creating and exploring methods for argumentation technology.
  • Anna Lindahl
  • Stian Rødven-Eide
  • Axel Almquist
  • Bill Noble
  • Christine Howes
  • Ellen Breitholtz
  • Vladislav Maraev
  • Martin Kaså
  • linguistics
  • computational linguistics
  • argumentation
  • text
  • dialogue
  • pragmatics
  • semantics
  • politics
  • forum
  • online discussion
  • argumentation technology
  • argument mining
2021 - 2028
Developing tools for systematic studies of text classification
  • Niklas Zechner
Catta
2022 - 2027
This program has two main aims, firstly to develop corpus-based methods for detecting semantic change (over time) and variation (across social groups and media). This will create general tools for the study and detection of language change at large-scale and directly benefit historical linguistics and lexicography. Secondly, we will collaborate with researchers from social sciences, gender studies, and literature to answer their research questions. We will develop tools, evaluation data, and research methodology for their specific needs.
  • Nina Tahmasebi
  • Simon Hengchen
  • Haim Dubossarsky
  • Dominik Schlechtweg
  • Shafqat Virk
  • Emma Sköldberg
  • Mats Malm
  • Mia Liinason
  • Sarah Valdez
  • Dirk Geeraerts
  • Stefano de Pascale
  • lexical-semantic-change
2021 -
CompSLA (Computational Second Language Acquisition) is a cooperation whose primary aim is to encourage the development of datasets and tools related to L2 (second language) learning for lower-resourced languages.
  • Elena Volodina
  • David Alfter
  • Arianna Masciolini
  • Yousuf Ali Mohammed
  • Ricardo Muñoz Sánchez
  • Maria Irena Szawerna