Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Forskning

Vår språkteknologiska forskning har sin tyngdpunkt i textbaserade empiriska studier och är nära knuten till utveckling av en nationell forskningsinfrastruktur, som syftar till att möjliggöra forskning på språkliga data, med särskilt fokus på svenska språket.

Språkbanken Texts mer än 20 aktiva forskare är framgångsrika inom ett brett spektrum av teman, såsom datorstödd språkinlärning, språkförändring, hantering av historiska texter, korpusbaserad grammatikforskning, OCR, lexikologi, biomedicinsk språkteknologi, sentiment- och argumentanalys, anonymisering och sökverktyg. Ofta görs detta i samarbete med experter från angränsande ämnen inom språkvetenskap, övrig humaniora och datavetenskap.

Projekt

2022 - 2028
HUMINFRA  är en ny distribuerad, nationell infrastruktur för forskning inom humaniora, konst och samhällsvetenskap.
  • Gerlof Bouma
  • Dana Dannélls
  • Markus Forsberg
  • Dimitrios Kokkinakis
  • Elena Volodina
2022 - 2025
Projektet ska med hjälp av konstruktionsgrammatik utveckla ett nätverk som (a) beskriver svenska språkliga konstruktioner och (b) länkar dem till konstruktioner i andra språk.
  • Benjamin Lyngfelt
  • Maia Andreasson
  • Kristian Blensenius
  • Linnea Bäckström
  • Steffen Höder
  • Peter Ljunglöf
  • Jonatan Uppström
  • linguistic typology
2023 - 2028
Mormor Karl är 27 år - är en forskningsmiljö som samlar kompetens från tre större områden för att studera pseudonymisering systematiskt, nämligen språkteknologi datavetenskap & dataintegritet lingvistik & språkinlärning. Avsikten är att genom forskningsmiljösatsningen stödja Sveriges arbete med öppen tillgång till forskningsdata.
  • Elena Volodina
  • Simon Dobnik
  • Xuan-Son Vu
  • Therese Lindström Tiedemann
  • pseudonymization
  • research data
  • språkteknologi
  • allmän lingvistik
  • svenska som andraspråk
  • pseudonymisering
  • dataintegritet
  • forskningsdata
2021 - 2028
Inom ramarna för projektet förvaltas och vidareutvecklas Svenska Akademiens lexikala databas (Salex). Vidare bedrivs arbete med Svenska Akademiens båda samtidsordböcker Svenska Akademiens ordlista (SAOL) och Svensk ordbok utgiven av Svenska Akademien (SO). Arbetet sker på uppdrag av och i samarbete med Svenska Akademien.
  • Kristian Blensenius
  • Markus Forsberg
  • Louise Holmer
  • Hans Landqvist
  • Stellan Petersson
  • Emma Sköldberg
  • Jonatan Uppström
  • Ann Lillieström
2020 - 2028
Ett samarbetsprojekt mellan Språkbanken Text, FLoV och CLASP som syftar att utarbeta metoder för språkteknologisk behandling av argumentation.
  • Anna Lindahl
  • Stian Rødven-Eide
  • Axel Almquist
  • Bill Noble
  • Christine Howes
  • Ellen Breitholtz
  • Vladislav Maraev
  • Martin Kaså
  • linguistics
  • computational linguistics
  • argumentation
  • text
  • dialogue
  • pragmatics
  • semantics
  • politics
  • forum
  • online discussion
  • argumentation technology
  • argument mining
2021 - 2028
Developing tools for systematic studies of text classification
  • Niklas Zechner
Catta
2022 - 2027
This program has two main aims, firstly to develop corpus-based methods for detecting semantic change (over time) and variation (across social groups and media). This will create general tools for the study and detection of language change at large-scale and directly benefit historical linguistics and lexicography. Secondly, we will collaborate with researchers from social sciences, gender studies, and literature to answer their research questions. We will develop tools, evaluation data, and research methodology for their specific needs.
  • Nina Tahmasebi
  • Simon Hengchen
  • Haim Dubossarsky
  • Dominik Schlechtweg
  • Shafqat Virk
  • Emma Sköldberg
  • Mats Malm
  • Mia Liinason
  • Sarah Valdez
  • Dirk Geeraerts
  • Stefano de Pascale
  • lexical-semantic-change
2021 -
CompSLA (Computational Second Language Acquisition) is a cooperation whose primary aim is to encourage the development of datasets and tools related to L2 (second language) learning for lower-resourced languages.
  • Elena Volodina
  • David Alfter
  • Arianna Masciolini
  • Yousuf Ali Mohammed
  • Ricardo Muñoz Sánchez
  • Maria Irena Szawerna
2022 - 2025
The market Language primarily is funded by MAW in which we look at the changing concepts around “the market”. They have transitioned from implying a concrete physical market to increasingly abstract markets like Europe-wide iron markets, as well as marriage and dating markets. They have also increasingly become actors in our lives, “the market reacted badly to the new corona restrictions”. We will complement the conceptual historians in-depth analyses with computational models of change. This project ranges 2022-2025.
  • Henrik Björck
  • Shafqat Virk
  • Claes Ohlsson
2024 - 2025
Hur skapas ny grammatik? Språkhistorisk forskning har främst studerat hur nya grammatiska ord och konstruktioner blir till. Med vårt projekt vill vi ta ett större grep och utforskar vi hur nya grammatiska konstruktioner tillsammans skapar ett grammatiskt nätverk. Vi fokuserar mer specifikt på hur verbkonstruktioner i nederländska gradvis bygger ett större nätverk under de senaste tvåhundra åren.
  • Evie Coussé
  • Gerlof Bouma