– Våra målsättningar går hand i hand. Vi på Språkbanken Text behöver forskningsdata samtidigt som KB vill hitta sätt att göra material tillgängligt. KB har en guldgruva med material som de inte kan dela med sig av på grund av upphovsrättsliga skäl, säger Markus Forsberg, föreståndare för Språkbanken Text.
KB-labb är Kungliga bibliotekets (KB) nystartade labb för datadriven forskning inom humaniora och samhällsvetenskap. Verksamhetsledare Love Börjesson säger att samarbetet med Språkbanken Text skapar fantastiska möjligheter att lyfta och tillgängliggöra KB:s samlingar på helt nya sätt.
- Nu kan vi implementera Språkbankens svenska NLP-tunnel Sparv, vilket ger forskare som använder KB-labb möjlighet att analysera och strukturera data på ett sätt som tidigare var omöjligt. Genom det här samarbetet får vi också en mycket högre utväxling på vår egen infrastruktur än vad som annars hade varit fallet.
Anne Schumacher, forskningsingenjör på Språkbanken Text, var nyligen på plats på KB-labb för att installera Sparv, Språkbankens annoteringsverktyg, på deras maskiner.
– KB har texter som vi är intresserade av men som de inte kan ge till oss. Nu kan KB-labb analysera texterna med hjälp av Sparv och sen extrahera alla ord, till exempel med en viss egenskap, och ge listor till oss. På så sätt får vi ut data från samlingarna utan att göra intrång i upphovsrätten, säger hon och tillägger att Språkbanken Text i sin tur kan analysera datan och även fritt dela med sig av listorna, så att vem som helst kan använda dem.
Språkbankens Markus Forsberg säger att samarbetet hittills gått otroligt smidigt.
– Vi har precis kommit igång, men det här känns som ett samarbete som vi kan bygga vidare på, där vi kan fokusera på analysen och de kan fokusera på att göra material tillgängliga, säger han.
Love Börjesson håller med och menar att samarbetet mellan KB-labb och Språkbanken Text innebär mycket goda nyheter för digital humaniora och samhällsforskning i Sverige. Han tillägger att det dessutom skapar ett intressant intellektuellt sammanhang där de olika verksamheterna berikar varandra på flera sätt utöver det specifika verktyg de delar och utvecklar.