Hoppa till huvudinnehåll

Flerordsworkshop 19/3 2013

Flerordsenheter i språkteknologi, språkvetenskap och språkinlärning

  • Tid: tisdagen den 19/3 2013 13.15-17.30
  • Plats: K332
  • Anmälan: (ej bindande) till yvonne.adesam (a) gu.se senast torsdag 14 mars. Meddela ev. specialkost för fika (vegan, laktos, gluten etc.)

Flerordsuttryck kan löst karakteriseras som språkliga uttryck som består av mer än ett ord, men där helheten har någon språklig egenskap (i form eller innehåll) som inte framgår av summan av de ingående ordens egenskaper tillsammans med allmänna regler för hur komplexa språkliga uttryck byggs upp.

Av olika skäl har lingvistiken ägnat betydligt mycket mindre uppmärksamhet åt flerordingar än åt enkla ord, men under senare år har de kommit att uppmärksammas alltmer, i språkteknologi (med en rad internationella flerordsworkshopar), i allmän språkvetenskap (inte minst arbeten inom konstruktionsgrammatik) samt i tillämpad språkvetenskap (med arbeten om flerordingarnas roll i andra- och främmandespråksinlärning).

Flerordingar står i fokus i två stora forskningsprojekt som bedrivs vid institutionen, SweFN++ <http://språkbanken.gu.se/swe/swefn> och ett svenskt konstruktikon <http://www.svenska.gu.se/forskning/forskningsprojekt/ett-svenskt-konstruktikon/>. Workshopen arrangeras inom ramarna för dessa projekt och dess syfte är att sprida information om vårt arbete i en större krets och att inbjuda till en allmän diskussion om flerordsenheter som lingvistiska beskrivningsobjekt.

Alla intresserade är välkomna. För att kunna beställa rätt mängd pausförfriskningar önskar vi dock en föranmälan via epost till yvonne.adesam (a) gu.se senast torsdag 14 mars (se ovan).


Program
 
13.15–13.30 Inledning
Lars Borin
13.30–14.30 Fraser, fraseindlæring og fraseværktøj [bilder i pdf]
Auður Hauksdóttir (Islands universitet)
  Leksikalsk kompetence er afgørende for beherskelsen af et fremmedsprog (jf. fx Hatch og Brown 1995, Meara 1996, Coady og Huckin 1997 og Na­tion 2001). Indlæringen af ordforråd omfatter både tilegnelsen af enkeltord og faste ordforbindelser eller fraser, fx idiomer, kollokationer, sammenlign­inger og kommunikative formler (fx Nattinger/DeCarrico 1997; Wray 2002; Schmitt 2004).

Det er ikke tilfældigt, hvor fraser forekommer og hvordan de bruges i tale og skrift. I det øjeblik man har valgt et register, en social situation eller en sprogbrugssituation, er det afgørende for sprogets brug, hvilket ordforråd der trækkes på. I forbindelse med indlæring af denne del af ordforrådet er det vigtigt at tage højde for frasetypernes forskellige karakter og funktion. For ikke-modersmålstalende kan det være svært at finde frem til de fraser, der passer til de forskellige situationer, og i andre tilfælde kan afkodning af fraserne være et problem. Når det gælder beslægtede sprog såsom dansk og islandsk, kan lighederne mellem frasepar på de to sprog lette indlæringen og brugen af denne del af ordforrådet, mens uforudsigelige forskelle kan føre på vildspor.

I oplægget diskuteres islændinges problemer i forbindelse med indlæring og brug af fraser på dansk. Det sprogteknologiske værktøj <http://www.frasar.net> præsenteres, og det drøftes, hvordan sprogteknologiske værktøjer af denne art kan lette sprogindlæringen og kommunikationen på målsproget. Der gøres rede for det arbejde, der har været forbundet med fraseværktøjets udvikling mht. sammenligning af fraser på dansk og islandsk, kobling til korpus, udarbejdelse af lydfiler og udvikling af søgemuligheder. Til sidst demonstreres selve fraseværktøjet og dets anvendelsesmulig­heder.
 
14.30–15.10 Konstruktioner i kontrast: Om svenska motsvarigheter till posterna i Berkeleys engelska konstruktikon [bilder i pdf]
Linnéa Bäckström, Benjamin Lyngfelt och Emma Sköldberg
  Grammatiska konstruktioner är väsentligen språkspecifika. Även om konstruktioner i olika språk kan vara påfallande lika varandra – pga. gemensamt arv, lån eller likartad utveckling – är de sällan helt ekvivalenta. Hur snarlika de än verkar finns det så gott som alltid några skillnader i form, betydelse, funktion eller åtminstone distribution (vilket ofta är ett tecken på funktionella skillnader). Detta är ett av huvudproblemen för tvärspråkliga ansatser med konstruktionsinriktning.

Å andra sidan gäller samma problem även ord, vilket inte har hindrat lexikografer från att producera användbara flerspråkiga ordböcker av olika slag. Där handlar det dock främst om att etablera semantisk och/eller funktionell ekvivalens, medan man vid konstruktionsanalys också måste ta hänsyn till form och intern struktur. Det går helt enkelt inte att bortse från dependensrelationer, konstituentstruktur och olika typer av grammatiska markörer och mönster när man ska karakterisera egenskaperna hos en konstruktion. Inte desto mindre är grundproblemet i princip detsamma.

Frågan blir extra aktuell vid uppbyggnaden av ett konstruktikon, en databas över ett språks konstruktioner. Sådana konstruktikon är för tillfället under utveckling för flera språk, inklusive engelska, svenska, japanska och brasiliansk portugisiska. Om de inte ska stanna vid att utgöra rent inomspråkliga resurser finns det ett antal kontrastiva frågor att beakta. Som ett led i detta har vi gått igenom alla nu befintliga konstruktionsposter, drygt 70 stycken, i Berkeleys engelska konstruktikon och undersökt i vilken utsträckning det är befogat att anta motsvarande konstruktioner i svenska.

Vi har inriktat oss på eventuella motsvarigheter snarare än (översättnings-)ekvivalenter. Den primära avsikten är att identifiera likheter och skillnader mellan näraliggande konstruktioner i engelska och svenska, inte att svara på hur de kan översättas. Somliga konstruktions­motsvarigheter skulle också fungera som konstruktionsekvivalenter, andra inte. En annan viktig skillnad gentemot flerspråkig lexikografi är som sagt att konstruktionsjämförelserna avser form och intern struktur lika väl som betydelse och funktion. För att möjliggöra tvärspråkliga tillämpningar av konstruktikonresurser fordras därför någon form av gemensamt beskrivningsspråk.

Vårt föredrag presenterar en översiktlig jämförelse mellan posterna i Berkeleys engelska konstruktikon och deras närmaste svenska motsvarigheter. En del av de skillnader som identifierades berör konstruktionerna i sig, medan andra följer av mer generella skillnader mellan språken (mer generella konstruktioner).
 
15.10–15.45 Kafferast
15.45–16.15 Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon [bilder i pdf]
Markus Forsberg
  Inom projektet Ett svenskt konstruktikon forskar vi om svenska konstruktioner som vi samlar in, beskriver och publicerar i en fritt tillgänglig resurs: <http://spraakbanken.gu.se/resurs/konstruktikon>.

Projektet fokuserar på partiellt schematiska konstruktioner, det vill säga på sådana med åtminstone ett lexikalt led. Ett exempel är [X och X] ('bra och bra') där upprepningen av X sätter X i fråga. Ett annat, mindre exotiskt exempel, är [RG kronor] ('5 kronor'). Partiellt schematiska konstruktioner anses vara mycket vanligt förekommande (se exempelvis Jackendoff 1997, 156), men samtidigt är de endast till en begränsad del utforskade, och då typiskt med fokus på de mer exotiska konstruktionerna. Denna situation vill vi förändra genom att sträva efter en heltäckande beskrivning.

Vår strävan efter en heltäckande beskrivning för oss till en grundläggande metodologisk fråga: Hur vi finner rätt på de konstruktioner som ännu inte blivit beskrivna i litteraturen? Denna fråga försöker vi besvara i projektets språkteknologiska del, där vi undersöker hur vi automatiskt kan identifiera nya konstruktionskandidater.

Arbetet med att identifiera konstruktionskandidater förutsätter att vi formulerar kriterier för vad som kännetecknar en kandidat, så att vi därefter kan utveckla språkteknologiska verktyg som förmår identifiera dessa i autentisk text. I föredraget presenterar vi våra första steg i den riktningen, där vi har utforskat olika typer av rangordningar av så kallade hybrid-ngram (Wible and Tsao, 2010). Dessa kandidater är tillgängliga för allmän beskådan här: <http://spraakbanken.gu.se/resurs/konstruktikon/kandidater>.
 
16.15–16.45 Konventionaliserade flerordsenheter i svenska som andraspråk [bilder i pdf]
Julia Prentice
  Studien som presenteras utgör en del i mitt avhandlingsprojekt (Prentice 2010) och fokuserar på behärskning av svenska konventionaliserade uttryck bland ungdomar med varierade språklig bakgrund. Materialet har samlats in med hjälp av en enkät som innehåller fyra test med fokus på olika aspekter av behärskningen av konventionaliserade uttryck. De kvantitativa resultaten visar att förstaspråkseleverna når signifikant högre resultat än andraspråkseleverna. Andraspråkseleverna med tidig startålder når dessutom signifikant högre resultat än de med senare start för sin inlärning av svenska. Startålder visar sig alltså vara en viktig faktor för informanternas behärskning av konventionaliserade uttryck i svenskan. Den kvalitativa analysen av en del av materialet ger vissa indikationer på att informanterna associerar mellan enskilda komponenter av två eller flera olika uttryck på ett sätt som ligger i linje med vissa teoretiska antaganden om mental representation av lexikala enheter.

I presentationen tänker jag också göra vissa kopplingar mellan ovannämnda studie och två aktuella forskningsprojekt som jag medverkar i nu. Det ena projektet handlar om framtagningen av en svensk akademisk ord- och fraslista <http://spraakbanken.gu.se/swe/forskning/akademiska-ordlistor> och fortsätter alltså på det rent lexikala spåret när det gäller flerordsenheter. Det andra projektet, Ett svenskt konstruktion <http://spraakbanken.gu.se/swe/resurs/konstruktikon> utgår ifrån ett teoretiskt (konstruktionsgrammatiskt) perspektiv, som berör gränslandet mellan lexikon och grammatik (Lyngfelt et al. 2012).
 
16.45–17.15 Flerordsenheter: Så många frågor, så få svar [bilder i pdf]
Lars Borin
  Flerordsenheter består av flera ord. Så långt är allt klart. Det mesta annat väcker fler frågor än vi har svar:

• Vilken sorts "ord" är det flera av?
• Ska de beskrivas som en sorts lexikonenheter eller en sorts syntaktiska enheter (eller båda eller något annat)?
• Hur ska man avgränsa dem så att man kan känna igen dem, räkna dem, etc.?
• Vilka sorters flerordsenheter finns det?
• Hurdan är deras typologi: Finns de i alla språk i samma omfattning? Hur tar man reda på det?
 
17.15–17.30 Avslutning
Lars Borin
Bilaga Storlek
PDF icon borin.pdf 1.95 MB
PDF icon backstrom-lyngfelt-skoldberg.pdf 416.34 KB
PDF icon forsberg.pdf 491.75 KB
PDF icon prentice.pdf 325.54 KB
PDF icon audur.pdf 225.87 KB