Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Fri ordföljd för sökningar i Korp

Inlagt av Arild Matsson 2024-02-21

Språkbankens ordforskningsplattform ger nu möjligheten att söka utan ordföljdsbegränsning i alla tre söklägen.

Med Korp kan man söka på ord i olika textmaterial och studera ordens sammanhang. Vilka adjektiv brukar förekomma tillsammans med "handel"? När började man hoppa över "har" framför verb i supinum?

Utgångsläget i Korp är att en sökning som innehåller flera token endast ger resultat som har de token i precis samma ordning. Sökfrågan "fri handel" ger alltså en träff på:

EUs regler säger att det ska vara fri handel mellan EU-länderna

Men inte på:

Självklart är en fri och rättvis handel centralt för ett exportberoende land som Sverige

Och inte heller på:

Det vi får tillbaka i form av fred, stabilitet och handel och fri rörlighet på den gemensamma marknaden är långt mycket mer

För att ta med sökresultat oavsett ordföljd kan man kryssa i rutan märkt i fri följd. Detta har tidigare endast varit möjligt i det enkla sökläget, men nu finns samma alternativ även i det utökade och det avancerade sökläget.

Alternativet "i fri följd"

Alternativet "i fri följd" i Korps tre söklägen.

En genomgång av Korps olika funktioner ges i användarhandledningen.

Kompatibla sökfrågor

Fri följd är inte applicerbart på alla typer av sökfrågor. Först och främst måste frågan förstås innehålla mer än ett token, och varje token måste ha minst ett kriterium. Funktionerna upprepning och gränser är inte heller kompatibla med fri följd.

I det avancerade sökläget erbjuds en stor uttrycksmöjlighet, genom frågespråket CQP. De avancerade funktionerna är i allmänhet inte kompatibla med fri följd. Om du får ett felmeddelande för din sökfråga kan det vara klokt att kontrollera att den fungerar utan fri följd.

Sökresultat

När sökfrågan har fri ordföljd begränsas i viss mån vilka funktioner som finns tillgängliga för att hantera sökresultatet. Framför allt blir funktionerna statistik och ordbild otillgängliga. Visningsläget KWIC (keywords in context) ersätts av en enklare visning, eftersom träffarna kan förekomma på helt olika platser i en mening. Istället för vertikalt linjerade träffar visas meningarna som brödtext med träffarna fetmarkerade.

Alternativ: wildcard med upprepning

Den som vill söka på flera token i given följd, men med valfria token däremellan, kan använda funktionen upprepning. Exempelvis kan frågan innehålla först "hund", sedan ett token som matchar vilket ord som helst och som upprepas mellan 0 och 100 gånger, och sedan "katt", se exempel.

Alternativ: disjunktion

För att ställa kriteriet att två eller flera token ska följa direkt efter varandra, men i valfri ordning, kan man formulera en CQP-fråga och använda disjunktionsoperatorn: "lite" "mycket" | "mycket" "lite", se exempel.

Tillsammans med upprepade wildcards fås ungefär samma effekt som sökalternativet fri följd, se exempel. Dessutom kan det kombineras med flera andra funktioner. Se till exempel blogginlägget Korp tips and tricks: using CQP labels to search for dependency structures.

Etiketter