Meny

Forskning

Språkbankens forskningsenhet utvecklar toppmodern språkteknologi och strävar efter både teoretiska och praktiska mål inom olika forskningsområden. Vår forskning fokuserar både på själva språkteknologin (skapandet av omfattande högkvalitativa resurser som behövs för utvecklingen av verktyg och algoritmer) och frågor från andra discipliner.

Filtrera och sortera projekt

Forskningstema

ALZ-RJ-Cognitive Decline

Forskningstema

ICALL - Intelligent Computer-Assisted Language Learning

Språkbanken is working on integration of available language technology for Swedish into the area of language learning, so-called ICALL.

Forskningstema

Lexical semantic change

At Språkbanken Text, we have an ongoing research theme that relates to computational modeling of word meaning called (computational) lexical semantic change. In this theme, we have both research projects and a larger research program.

Forskningstema

Svenskt frasnät++

Svenskt frasnät++ (SweFN++) är en långsiktig satsning med syfte att bygga en omfattande lexikal infrastruktur för svensk språkteknologi. Det initierades 2008 och har tack vore olika forskningsbidrag växt under åren.

Forskningstema

Publikationer

Forskningstema

Bidragande projekt

Change is Key!

2022–2027

This program has two main aims, firstly to develop corpus-based methods for detecting semantic change (over time) and variation (across social groups and media). This will create general tools for the study and detection of language change at large-scale and directly benefit historical linguistics and lexicography. Secondly, we will collaborate with researchers from social sciences, gender studies, and literature to answer their research questions. We will develop tools, evaluation data, and research methodology for their specific needs.

  • Nina Tahmasebi
  • Simon Hengchen
  • Haim Dubossarsky
  • Dominik Schlechtweg
  • Shafqat Mumtaz Virk
  • Emma Sköldberg
  • Mats Malm
  • Mia Liinason
  • Sarah Valdez
  • Dirk Geeraerts
  • Stefano de Pascale
  • lexical-semantic-change
cassandra logo

Cassandra: Explaining and predicting short-term language change in Modern Swedish

2021–2024

Linguists often try to explain language change, but all our explanations are necessarily post hoc and thus difficult to evaluate. What happens if we turn to the future instead of the past and try to predict language change?

  • Aleksandrs (Sasha) Berdicevskis
  • Yvonne Adesam
  • Nina Tahmasebi
  • Evie Coussé
  • linguistics
  • computational linguistics
  • language change
  • language evolution
  • sociolinguistics
Catta

Catta

2021–    

Developing tools for systematic studies of text classification

  • Niklas Zechner

    Svenska Akademiens samtidsordböcker

    2021–2023

    Inom ramarna för projektet förvaltas och vidareutvecklas Lexikalisk databas. Vidare bedrivs arbete med Svenska Akademiens båda samtidsordböcker Svenska Akademiens ordlista (SAOL) och Svensk ordbok utgiven av Svenska Akademien (SO). Arbetet sker på uppdrag av och i samarbete med Svenska Akademien.

    • Kristoffer Andersson
    • Kristian Blensenius
    • Markus Forsberg
    • Louise Holmer
    • Hans Landqvist
    • Leif-Jöran Olsson
    • Stellan Petersson
    • Anne Schumacher
    • Emma Sköldberg
    • Jonatan Uppström
      Gold reserve

      SuperLim: en svensk testmängd för språkmodeller

      2020–2021

      Målet med projektet är att skapa högkvalitativa testmängder för att möjliggöra för alla aktörer inom svensk NLP att utvärdera och jämföra språkmodeller.

      • Markus Forsberg
      • Yvonne Adesam
      • Aleksandrs (Sasha) Berdicevskis
      • Dana Dannélls
      • Felix Morger
      • Gerlof Bouma
      • Magnus Sahlgren
      • Love Börjeson
      • Johanna Bergman
      • utvärdering
      • språkmodeller
      • fördomar

      Argumentation analysis and technology

      2020–    

      Ett samarbetsprojekt mellan Språkbanken Text, FLoV och CLASP som syftar att utarbeta metoder för språkteknologisk behandling av argumentation.

      • Anna Lindahl
      • Stian Rødven Eide
      • Axel Almquist
      • Bill Noble
      • Christine Howes
      • Ellen Breitholtz
      • Vladislav Maraev
      • Martin Kaså
      • linguistics
      • computational linguistics
      • argumentation
      • text
      • dialogue
      • pragmatics
      • semantics
      • politics
      • forum
      • online discussion
      • argumentation technology
      • argument mining

      Rumour mining

      2020–2023
      • Jacobo Rouces
      • Lars Borin
      • Mia-Marie Hammarlin
      • Fredrik Miegel
      • digital humanities

      Text classification of medical publications about person-centred care

      2019–2021

      Computerised text classification is used to help identify documents on the topic of patient-centred care.

      • Niklas Zechner

        Hot och hat mot journalister

        2019–2023

        Under vilka förutsättningar försvagas yttrandefrihet och demokrati av hat och hot mot journalister online?

        • Peter Ljunglöf
        • Oscar Björkenfeldt
        • Måns Svensson

          Svenskt språkdatalabb

          2019–2021

          Målet med Svenskt Språkdatalabb är att skapa en nationell kunskapsnod inom språkteknologi, och ta fram svenska referensdatamängder för NLP som sedan tillgängliggörs med öppen access i AI Innovation of Swedens datafabrik.

          • Peter Ljunglöf
          • Aleksandrs (Sasha) Berdicevskis

            Towards Computational Lexical Semantic Change Detection

            2019–2022

            I det här projektet bygger vi automatiska, korpus-baserade verktyg för att studera lexikala semantiska förändringar för både det svenska och engelska språket.

            • Nina Tahmasebi
            • Simon Hengchen
            • Richard Johansson
            • Maria Koptjevskaja Tamm

              Evaluation and refinement of an enhanced OCR-process for mass digitisation

              2019–2020

              The purpose of this project is to fine-tune and evaluate a test platform for OCR-production that was developed by Kungliga biblioteket (KB) in cooperation with the Norwegian software company Zissor in 2017.

              • Dana Dannélls
              • Lars Björk
              • Torsten Johansson
              • OCR
              • digital humanities
              • historiskt material
              • kulturarv
              • language technology

              The rise of complex verb constructions in Germanic

              2018–    

              The project studies the rise of complex verb constructions in Germanic.

              • Evie Coussé
              • Gerlof Bouma
              • Nicoline van der Sijs
              • Dirk-Jan de Kooter
              • Trude Dijkstra

                Milage: Multilingual Automated Grammar Extraction

                2018–2022
                • Shafqat Mumtaz Virk
                • Markus Forsberg
                • Harald Hammarström

                  DReaM: The Dictionary/Grammar Reading Machine

                  2018–2020

                  A Multilingual Annotated Corpus of Grammars for the World's Languages

                  • Shafqat Mumtaz Virk
                  • Markus Forsberg
                  • Harald Hammarström

                    L2 profiler för svenska

                    2018–2021

                    The L2P project sets to describe Swedish Second Language learner lagnuage from the point of view of receptive and productive linguistic knowledge by level of proficiency, as contrasted on the basis of learner essays (SweLL-pilot corpus) and textbook texts (COCTAILL corpus).

                    • Elena Volodina
                    • Therese Lindström Tiedemann
                    • Yousuf Ali Mohammed
                    • David Alfter
                    • ICALL
                    • NLP4CALL
                    • linguistic complexity
                    • SLA
                    • second language learning
                    • CEFR profiles

                    SweLL - Infrastruktur för L2 svenska

                    2017–2020

                    SweLL syftar till att skapa en plattform för att samla in, digitalisera, normalisera, lingvistiskt annotera och elektroniskt tillgängliggöra texter skrivna av inlärare av svenska.

                    • Elena Volodina
                    • Yousuf Ali Mohammed
                    • Arild Matsson
                    • Mats Wirén
                    • Beáta Megyesi
                    • Julia Prentice
                    • Gunlög Sundberg
                    • Lena Granstedt
                    • Monica Reichenberg
                    • Lisa Rudebeck
                    • Second language infrastructure
                    • Swedish as a second language
                    • essay annotation
                    • correction annotation
                    • pseudonymization

                    Språkliga och extra-lingvistiska parametrar för tidig upptäckt av kognitiv svikt

                    2016–2019
                    • Dimitrios Kokkinakis
                    • Kristina Lundholm Fors
                    • Malin Antonsson
                    • Marie Eckerström
                    • Charalambos Themistocleous
                    • language disorders

                    Digital LSI

                    2015–2021

                    Digitization of Grierson’s Linguistic Survey of India (LSI; 1903-1927)

                    • Lars Borin
                    • Shafqat Mumtaz Virk
                    • Anju Saxena
                    • Bernard Comrie

                      Språkteknologiska länkade öppna data vid Språkbanken

                      2014–2014

                      Syftet med projektet är att tillgängliggöra lexikala resurser för språkteknologi i form av länkade öppna data åtkomliga via Språkbanken.

                      • Lars Borin
                      • Dana Dannélls
                      • Markus Forsberg
                      • LOD
                      • Semantiska webben
                      • länkad data

                      Koala – Korps lingvistiska annotationer

                      2014–2017

                      Förbättrad annotering för Korps korpusinfrastruktur

                      • Yvonne Adesam
                      • Lars Borin
                      • Gerlof Bouma
                      • Markus Forsberg
                      • Richard Johansson

                        Corpus-driven induction of linguistic knowledge

                        2014–2018

                        We will apply corpus-driven methods as a way to expand and correct existing hand-crafted linguistic resources, and conversely we will use hand-crafted resources as additional sources of supervision when learning meaning representations automatically.

                        • Richard Johansson
                        • Luis Nieto Piña

                          MAÞiR

                          2014–2017

                          Utveckling av automatiska annoteringsverktyg för fornsvenska texter.

                          • Gerlof Bouma
                          • Yvonne Adesam

                            En fri molntjänst för OCR

                            2013–2014
                            • Dana Dannélls
                            • Lars Borin
                            • Gerlof Bouma
                            • OCR
                            • historiskt material

                            SweCcn -- ett svenskt konstruktikon

                            2013–2016

                            Projektet går ut på att utveckla en databas över svenska konstruktioner, ett s.k. konstruktikon.

                            • Lars Borin
                            • Dana Dannélls
                            • Markus Forsberg
                            • Leif-Jöran Olsson
                            • Jonatan Uppström
                            • Benjamin Lyngfelt
                            • Kristian Blensenius
                            • Linnea Bäckström
                            • Anna Ehrlemark
                            • Per Malm
                            • Joel Olofsson
                            • Julia Prentice
                            • Rudolf Rydstedt
                            • Emma Sköldberg
                            • Sofia Tingsell
                            • Lexicography
                            • integrerad lexikonresurs
                            • constructicon

                            Towards a Knowledge-Based Culturomics

                            2013–2018

                            The main aim of this research program is to advance the state of the art in language technology resources and methods for semantic processing of Swedish text, in order to provide researchers and others with more sophisticated tools for working with the information contained in large volumes of digitized text, e.g., by being able to correlate and compare the content of texts and text passages on a large scale.

                            • Jacobo Rouces
                            • Lars Borin
                            • Nina Tahmasebi
                            • Dimitrios Kokkinakis
                            • Pierre Nugues
                            • Richard Johansson
                            • Dubhashi Devdatt
                            • culturomics

                            Funktionella somatiska symtom

                            2013–2014

                            Tolkning och förståelse av funktionella symtom i primärvården

                            • Dimitrios Kokkinakis
                            • Eva Lidén
                            • Elisabeth Björk Brämberg
                            • Sylvia Määttä
                            • Staffan Svensson

                              PINCORE

                              2012–2016

                              Personcentrerad information och kommunikation till personer med kolorektal cancer som genomgår kirurgi

                              • Dimitrios Kokkinakis

                                META-NORD

                                2011–2013

                                Projektet META-NORD har som mål att etablera en öppen lingvistisk infrastruktur i de baltiska och nordiska länderna.

                                • Lars Borin
                                • Markus Forsberg

                                  Akademiska ordlistor

                                  2011–2014
                                    • Lexicography
                                    • second language learning
                                    • NLP4CALL

                                    A System Architecture for ICALL

                                    2011–2013
                                    • Lars Borin
                                    • Elena Volodina
                                    • Hrafn Loftsson
                                    • Birna Arnbjörnsdóttir
                                    • ICALL
                                    • NLP4CALL
                                    • Swedish as a second language
                                    • Second language infrastructure
                                    • second language learning
                                    • s

                                    MedEval

                                    2011–2012

                                    En svensk medicinsk testkollektion

                                    • Karin Friberg Heppin
                                    • Anni Järvelin

                                      Svenskt frasnät++ (SweFN++)

                                      2011–    

                                      SweFN++-projektet handlar om att skapa en central infrastrukturkomponent för svensk språkteknologi, nämligen en stor fritt tillgänglig lexikonresurs med rik lingvistisk information.

                                      • Lars Borin
                                      • Dana Dannélls
                                      • Dimitrios Kokkinakis
                                      • Markus Forsberg
                                      • Jonatan Uppström
                                      • Leif-Jöran Olsson
                                      • Malin Ahlberg
                                      • Maria Toporowska Gronostaj
                                      • Karin Friberg Heppin
                                      • Richard Johansson
                                      • lexikon
                                      • lexikal semantik
                                      • modern
                                      • integrerad lexikonresurs
                                      • frasnät

                                      MOLTO - Multilingual Online Translation

                                      2010–2013

                                      MOLTO: s mål är att utveckla en uppsättning verktyg för att översätta texter mellan flera språk i realtid med hög kvalitet. Språk är separata moduler i verktyget och kan varieras. prototyper som täcker en majoritet av EU: s 23 officiella språk kommer att byggas.

                                      • Dana Dannélls
                                      • Generation
                                      • translation
                                      • multilingual
                                      • cultural heritage
                                      • GF

                                      Digital areal linguistics

                                      2010–2014

                                      The goal of this project is to create a database of comparable lexical items in a number of representative languages spoken in the Himalayan region in India and to use this database for investigating the Himalayas as a linguistic area.

                                      • Lars Borin
                                      • Taraka Rama
                                      • Anju Saxena
                                      • Bernard Comrie
                                      • language technology
                                      • areal linguistics
                                      • linguistic typology
                                      • computational linguistics
                                      • Lexicography

                                      Kelly - KEywords for Language Learning for Young and adults alike

                                      2009–2011
                                      • Elena Volodina
                                      • Sofie Johansson Kokkinakis
                                      • ICALL
                                      • NLP4CALL
                                      • second language learning
                                      • CEFR profiles
                                      • Swedish as a second language

                                      CONPLISIT

                                      2009–2010

                                      Consumption patterns and life-style in Swedish literature – novels 1830-1860

                                      • Lars Borin
                                      • Markus Forsberg
                                      • Christer Ahlberger