Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

BibTeX

@inProceedings{johansson-rogstrom-2022-digitaliserad-326866,
	title        = {Digitaliserad 1700-talstext som lexikaliskt verktyg – utmaningar och möjligheter},
	abstract     = {Refereegranskat bidrag till NFL-konferensen 2022 i form av poster.


Digitaliserad 1700-talstext som lexikaliskt verktyg – utmaningar och möjligheter

Sofie Johansson & Lena Rogström
Institutionen för svenska, flerspråkighet och språkteknologi, Göteborgs universitet

Modern lexikografi baseras idag på stora elektroniskt tillgängliga korpusar som kan analyseras
med en mängd digitala verktyg. Ett sådant är SPARV (Borin et al. 2016) som möjliggör
morfosyntaktisk analys av texter, vilket t.ex. är användbart vid kartläggning och studier av
språkbruk på ord-, fras- och meningsnivå.
SPARV kan användas vid analys av äldre texter, men för text tillkommen före 1800-talet är den
större variationen i stavning fortfarande ett problem, vilket begränsar analyser för t.ex.
språkhistoriska ändamål.

I vår posterpresentation visar vi hur vi inom projektet Digitalisering av Kungliga
Vetenskapsakademiens Handlingar (finansierat av Centrum för Digital Humaniora vid
Hum.Fak., Göteborgs universitet) utnyttjar AI och teckenigenkänningsverktyg samt moderna
lexikologiska metoder på vetenskaplig text från 1700-talet för att kartlägga framväxten av ett
vetenskapligt ordförråd. Vi har t.ex. upprättat ordlistor i syfte att skapa en bild av det ordförråd
som användes då och som skiljer sig ifrån dagens språk, antingen ortografiskt eller pragmatiskt.
Genom att använda lexikala profiler kan graforden studeras ur ett frekvensbaserat perspektiv
samt jämföras med ordlistor med modern svenska.

Vi analyserar också materialet i Språkbankens analysverktyg SPARV i syfte att kunna upprätta
lexikaliska profiler över såväl specifika subgenrer som författare. I detta arbete är vårt mål att
kunna visa hur delar av den ortografiska variationen kan kopplas till KARPs lexikon (Borin et
al. 2012) och därigenom förbättra analysmöjligheterna också för texter från 1700-talet.
Dessa resultat kan utnyttjas för såväl historisk lexikografi (SAOB.2) som för vår kunskap om
fackspråksetablering, vetenskapligt språkbruk och lexikalisk utveckling generellt sett.

Referenser
Lars Borin, Markus Forsberg, Martin Hammarstedt, Dan Rosén, Roland Schäfer, Anne
Schumacher. 2016. Sparv: Språkbanken’s corpus annotation pipeline infrastructure.
Proceedings of SLTC 2016. The Sixth Swedish Language Technology Conference.
Lars Borin, Markus Forsberg, Leif-Jöran Olsson, and Jonatan Uppström. 2012. The open
lexical infrastructure of Språkbanken. In Proceedings of the Eighth International Conference
on Language Resources and Evaluation (LREC'12), Istanbul: ELRA. 3598-3602
Nyckelord: Fackordförråd;1700-talstext; morfosyntaktisk analys; lexikal profil
},
	booktitle    = {Book of abstracts, NFL, Lund 4-6 maj 2022},
	author       = {Johansson, Sofie and Rogström, Lena},
	year         = {2022},
}