Language descriptions are documents containing valuable information on the world's natural languages and their diversity. In this blog, we report a multilingual corpus of thousands of such documents annotated with a number of meta, lexical, and syntactical attributes.
Zipfs lag, uppkallad efter den amerikanske lingvisten George Kingsley Zipf, säger att ett ords frekvens är omvänt proportionellt mot dess plats i en frekvenslista. Vad innebär det?
Automatisk identifiering av lexikosemantiska förändringar, alltså möjligheten att med datorers hjälp hitta när ord förändrar sina betydelser över tid, är ett aktivt forskningsfält inom språkteknologi. Towards Computational Lexical Semantic Change Detection är ett forskningsprojekt som knyter an till fältet. Projektet, som startade i januari 2019, finansieras av Vetenskapsrådet och leds av Nina Tahmasebi, docent vid Språkbanken Text, Institutionen för svenska språket på Göteborgs universitet.
Att omvandla text till tal, och tvärtom. Det är vad KTH-forskaren Jens Edlund (föreståndare för Språkbanken Tal) med kollegor fått drygt 20 miljoner kronor i anslag för att jobba med. Det handlar bland annat om att ta fram teknik som klarar av att lyssna igenom Kungliga bibliotekets mediearkiv och göra det sökbart.