Meny

Språkteknologiska länkade öppna data vid Språkbanken

Bakgrund

Projektet språkteknologiska länkade öppna data vid Språkbanken (Language Technology Linked Open Data at Språkbanken -- hädanefter LTLOD@SB), dnr 2013-04996, finansieras av VINNOVA (januari -- augusti 2014).

Projektbeskrivning

Syftet med projektet är att tillgängliggöra lexikala resurser för språkteknologi från de två deltagande institutionerna (Språkbanken och DART) i form av länkade öppna data åtkomliga via Språkbanken.Därmed blir resurserna optimalt tillgängliga för en mängd ändamål -- forskning, utbildning, produkt- och tjänsteutveckling, både kommersiell och offentlig.

Lexikonresurser är centrala i de flesta språkteknologiska tillämpningar. Att utveckla informationsrika lexikonresurser kräver stora arbetsinsatser även i de fall delvis automatiska metoder används, som ofta i språkteknologisammanhang. Det är därför väsentligt att dessa resurser kan återanvändas i största möjliga utsträckning. Att göra dem tillgängliga i form av länkade öppna data är i dagens värld en förutsättning för att resurserna ska få maximal användning i forskning, utbildning, samt produkt- och tjänsteutveckling, både kommersiell och offentlig. Det är idag även ett av de bästa sätten att generera ny kunskap genom att resurserna kommer att ingå i ett globalt nätverk av länkade språkliga data som därigenom kan kombineras på nya sätt.

Fokus Concept Coding Framework (CCF)

För att ge ett gott språkligt stöd till personer som har behov av alternativ och kompletterande kommunikation (AKK) krävs god tillgång till språkligt material i lämpliga representationsformer, såsom teckenspråksmaterial (i ritad form eller som video), symbol- och bildbibliotek på flera kognitiva nivåer, samt textstöd för dessa på efterfrågade språk. Hittills har material av detta slag utvecklats och underhållits separat och isolerat från vartannat, antingen som kommersiella produkter, eller av olika ideella organisationer med inriktning på specifika målgrupper och behov. Detta arbetssätt är exklusivt och dyrt, och ger begränsad nytta.

Att föra in ett antal av de viktigare fria alternativen inom området under ett allmänt lexikalt och språkteknologiskt paraply kommer att innebära ett stort steg framåt mot att kunna administrera och underhålla dessa tidigare exklusiva resurser som en naturlig del av en allmän infrastruktur för multi-modala språkliga verktyg – för svenska och successivt för fler språk. Tidigare exklusiva AKK-material blir allmänt tillgängliga för bredare användning som stöd för tidig läs- och skrivinlärning och andraspråksinlärning. AKK-behov kan enklare tillfredsställas i en inkluderande miljö och på betydligt mer kostnadseffektiva villkor. Detta är särskilt angeläget och värdefullt i dagens flerspråkliga och mångkulturella verklighet.

Att koppla CCF-teknologin, och de symbolrepresentationer som ingår i denna (f.n. Bliss och ARASAAC), till Språkbanken genom ett gemensamt format för öppna länkade data innebär ett stort och unikt steg i den riktning som här skisserats.

Lexikonresurser

Länkar

Institutioner/organizationer

Dart

Språkbanken