Skip to main content

News archive

Forskare på KTH omvandlar text till tal, och tvärtom. Nu ska ett av världens största mediearkiv bli sökbart.

Att omvandla text till tal, och tvärtom. Det är vad KTH-forskaren Jens Edlund (föreståndare för Språkbanken Tal) med kollegor fått drygt 20 miljoner kronor i anslag för att jobba med. Det handlar bland annat om att ta fram teknik som klarar av att lyssna igenom Kungliga bibliotekets mediearkiv och göra det sökbart.

Att omvandla text till tal, och tvärtom. Det är vad KTH-forskaren Jens Edlund (föreståndare för Språkbanken Tal) med kollegor fått drygt 20 miljoner kronor i anslag för att jobba med. Det handlar bland annat om att ta fram teknik som klarar av att lyssna igenom Kungliga bibliotekets mediearkiv och göra det sökbart.

Nina Tahmasebi ny docent inom växande forskningsfält

När Nina Tahmasebi började forska kring automatiska metoder för att studera språkförändringar var hon en av få inom fältet. 

– I år höll vi vår första internationella workshop och fick över 50 inskickade artiklar. Att få vara med om detta känns enormt roligt!

Nu har Nina Tahmasebi antagits som docent vid Institutionen för svenska språket på Göteborgs universitet. 

Språkteknologi hjälper digitala verktyg att förstå ord med flera betydelser

För att fungera korrekt behöver digitala verktyg kunna förstå om det är musiken eller klädesplagget som avses med ordet ”rock”, och om det med ”damm” menas en vattensamling eller smuts i hörnen.

I sin avhandling visar Luis Nieto Piña, doktorand vid Språkbanken, Göteborgs universitet att det är möjligt för datorer som använder mänskligt språk att automatiskt lära sig de olika betydelserna av ord med fler än en innebörd.

Språkteknologi och AI ska hjälpa Arbetsförmedlingen

Nationella språkbanken på institutionen för svenska språket vid Göteborgs universitet ska hjälpa Arbetsförmedlingen i sitt nya uppdrag.

Under våren kommer Språkbanken att träna en ny språkmodell med hjälp av AI, väl på plats ska modellen bidra till att automatisera Arbetsförmedlingens analysarbete. Peter Ljunglöf och Dan Rosén är ansvariga för arbetet med att träna språkmodellen. 

Ny teknik gör det lättare att identifiera förfalskade texter

Ny teknik har gett oss nya möjligheter, och nya behov av, att analysera och klassificera text, med avseende på vem eller vilka som har skrivit den.

Runt tio tusen ord behövs för att ha en rimlig chans att identifiera en skribent. Detta skriver Niklas Zechner, expert på Språkbanken på institutionen för svenska språket, i en artikel i Språktidningen. 

Nytt projekt om automatiska metoder för att upptäcka språkförändring

I takt med att vår värld och vår livsstil förändras, förändras även vårt språk. Vi lär oss nya ord, skaffar nya betydelser på existerande ord eller förändrar betydelser så att de passar in för att beskriva vår värld och vår tid. Vi glömmer fort och när vi tittar tillbaka, t.ex. i gamla tidningsmaterial så är det inte alltid lätt att förstå vad som menats. Vem kommer t.ex. ihåg yuppienallen eller vad ordet guzz betyder?

Projektet Mot automatiska metoder för att upptäcka språkförändring kommer att bygga verktyg för att studera vårt språk och dess förändringar i större skala.

Man kommer att använda sig av en kombination av distributionell semantik och betydelseinduktion för kunna svara både på vad som ändrats och när. Språkbankens mycket stora samlingar av svensk text kommer att användas, i ett världsunikt samarbete mellan semantiker och språkteknologer som med sina respektive expertiser har mycket goda förutsättningar att finna nya, automatiska metoder samt att i större skala svara på existerande hypoteser och deras generalisering till andra datamängder och tidsepoker.

Det nyss beviljade forskningsbidraget är knutet till Språkbanken, institutionen för svenska språket vid Göteborgs universitet. Nina Tahmasebi, en av Språkbankens forskare i språkteknologi som också leder projektet, kommer att utföra och analysera undersökningar samt utveckla delar av de datorprogram som kommer att användas i projektet.

Projektet finansieras av Vetenskapsrådet jan 2019 - dec 2022.

Medverkande parter i projektet är Richard Johansson från Chalmers tekniska högskola, Maria Koptjevskaja Tamm och Susanne Vejdemo från Stockholms universitet.

Nytt projekt om en förbättrad OCR-process vid massdigitalisering

Utvärdering och anpassning av en förbättrad OCR-process vid massdigitalisering

För att förbättra produktionen av maskinläsbar text initierade Kungliga biblioteket ett projekt med syfte att utveckla en modul för OCR-bearbetning där centrala parametrar kan justeras för att matcha specifik karaktäristik hos källmaterialet. Detta projekt syftar till att tillsammans med Språkbanken genomföra en formell utvärdering av, samt förbättra detta redskap genom systematiska textanalyser, lexikon och ordlistor med målet att det ska implementeras KB:s massdigitaliseringsprocess för dagstidningar.

Projektet finansieras av Riksbankens Jubileumsfond (RJ) jan 2019 - dec 2020.

Samarbetspartners:
Kungliga biblioteket
Språkbanken

Läs mer om projektet här:
https://www.rj.se/anslag/2018/utvardering-och-anpassning-av-en-forbattrad-ocr-process-vid-massdigitalisering/
och här:
https://svenska.gu.se/aktuellt/nyheter/fulltextnationella-sprakbanken-forbattrar-digitaliseringen-av-dagstidningar.cid1591862

Svenska språket och Språkbanken på Bokmässan

På torsdag 27 september öppnar Bokmässan dörrarna för besökare på Svenska mässan i Göteborg. Institutionen för svenska språket medverkar för tredje året i rad och tar plats i Göteborgs universitets monter, B07:74.
I montern kommer det att erbjudas både programpunkter på monterscenen och aktiviteter på mässgolvet. På Institutionen för svenska språkets webbsida hittar du alla de aktiviteter som institutionen bidrar med. En av programpunkterna är Vad avslöjar bildberättande om hjärnan? med två av Språkbankens forskare, Kristina Lundholm Fors, forskare och universitetslektor i logopedi och Dimitrios Kokkinakis, forskare i språkteknologi.

Varmt välkommen!