Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Analyser

Här kan du söka bland våra analyser. Du klickar på en rad för att få fram mer information.
Analys Sortera fallande Samlingar Uppgift Enhet Språk
eng-dependency-stanza
Dependensparsning med Stanzas standardmodell för engelska
dependency parsing token engelska
eng-lemmatization-stanza
Lemmatisering med Stanzas standardmodell för engelska
lemmatization token engelska
eng-msd-stanza-ufeats
Morfologisk analys för engelska med universal features (UD) baserad på Stanza
morphosyntactic tagging token engelska
eng-namedentity-stanza
Namnigenkänning (NER) med Stanzas standardmodell för engelska
named entity recognition engelska
eng-pos-stanza
Annotering av ordklasser (Penn Treebank-taggar) med Stanzas standardmodell för engelska
part-of-speech tagging token engelska
eng-pos-stanza-upos
Annotering av UD-ordklasser (universal dependencies) med Stanzas standardmodell för engelska
part-of-speech tagging token engelska
eng-sentence-stanza
Meningssegmentering med Stanzas standardmodell för engelska
sentence segmentation sentence engelska
eng-tokenization-stanza
Tokenisering med Stanzas standardmodell för engelska
tokenization token engelska
Samling
mink-analyses
Samling av analyser som används i Mink
svenska
paragraph-sparv-blanklines
Segmenterar text i stycken utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
tokenization paragraph
paragraph-sparv-linebreaks
Segmenterar text i stycken utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
paragraph segmentation paragraph
paragraph-sparv-whitespace
Segmenterar text i stycken utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
paragraph segmentation paragraph
sentence-punkt
Segmenterar text i meningar utifrån skiljetecken med hjälp av NLTKs RegexpTokenizer
sentence segmentation sentence
sentence-sparv-blanklines
Segmenterar text i meningar utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
tokenization sentence
sentence-sparv-linebreaks
Segmenterar text i meningar utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
sentence segmentation sentence
sentence-sparv-whitespace
Segmenterar text i meningar utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
sentence segmentation sentence
Samling
standard-analyses-swe
Samling av Sparv-analyser för modern svenska
svenska
swe-compound-sparv-saldolemgram
Analys av sammansatta SALDO-lemgram inklusive sannolikhetsrankning
mink-analyses, standard-analyses-swe compound analysis token svenska
swe-compound-sparv-saldowords
Analys av sammansatta SALDO-ordformer
mink-analyses, standard-analyses-swe compound analysis token svenska
swe-dependency-malt-treebank
Svensk dependensparsning tränad på Svensk trädbank baserad på MaltParser
dependency parsing token svenska
swe-dependency-stanza-stanzasynt
Svensk dependensparsning tränad på Svensk trädbank med Stanza
mink-analyses, standard-analyses-swe dependency parsing token svenska
swe-geotagcontext-sparv
Annotering av texter med platsinformation, baserad på platser som finns i texten
standard-analyses-swe geotagging text svenska
swe-geotagmetadata-sparv
Annotering av texter med platsinformation, baserad på platser som finns i texten
geotagging text svenska
swe-lemgram-sparv-saldo
Uppslagning som ger SALDO-lemgram
mink-analyses, standard-analyses-swe lexical lookup token svenska
swe-lemmatization-sparv-saldo
Fullformsuppslagning som ger SALDO-grundformer
lemmatization token svenska
swe-lemmatization-sparv-saldo2
SALDO-grundformer plus analys av sammansättningar bestående av SALDO-ingångar
mink-analyses, standard-analyses-swe lemmatization token svenska
swe-lemmatization-stanza-stanzalem
Annotering av grundformer (lemman) med Stanza för svenska tränat på SUC3
lemmatization token svenska
swe-lexical_classes_text-sparv-blingbring
Lexikala klasser från Blingbring på textnivå
mink-analyses, standard-analyses-swe lexical classes text svenska
swe-lexical_classes_text-sparv-swefn
Lexikala klasser från SweFN på textnivå
mink-analyses, standard-analyses-swe lexical classes text svenska
swe-lexical_classes_token-sparv-blingbring
Lexikala klasser från Blingbring på tokennivå
mink-analyses, standard-analyses-swe lexical classes token svenska
swe-lexical_classes_token-sparv-swefn
Lexikala klasser från SweFN på tokennivå
mink-analyses, standard-analyses-swe lexical classes token svenska
swe-msd-hunpos-suc3
Annotering av morfosyntaktiska deskriptorer (SUC) med Hunpos för svenska
morphosyntactic tagging token svenska
swe-msd-hunpos-suc3-1800
Annotering av morfosyntaktiska deskriptorer (SUC) med Hunpos för 1800-talssvenska
morphosyntactic tagging token svenska
swe-msd-stanza-stanzamorph-suc3
Annotering av morfosyntaktiska deskriptorer (SUC) med Stanza för svenska
mink-analyses, standard-analyses-swe morphosyntactic tagging token svenska
swe-msd-stanza-stanzamorph-ufeats
Morfologisk analys för svenska med universal features (UD) baserad på Stanza
mink-analyses, standard-analyses-swe morphosyntactic tagging token svenska
swe-namedentity-swener
Namnigenkänning känner igen och förser namn och namnliknande uttryck (s.k. entiteter) i löpande text med fördefinierade etiketter, som organisation, person eller plats.
mink-analyses, standard-analyses-swe named entity recognition svenska
swe-phrasestructure-sparv
Svensk frasstrukturparsning baserad på Mamba-Dep dependensanalys
phrase structure parsing svenska
swe-pos-hunpos-suc3
Annotering av SUC-ordklasser med Hunpos för svenska
part-of-speech tagging token svenska
swe-pos-hunpos-suc3-1800
Annotering av SUC-ordklasser med Hunpos för 1800-talssvenska
part-of-speech tagging token svenska
swe-pos-stanza-stanzamorph
Annotering av SUC-ordklasser med Stanza för svenska
mink-analyses, standard-analyses-swe part-of-speech tagging token svenska
swe-readability-sparv-lix
Annotering av svenska texter med LIX-värden som indikerar hur lätt eller svår en text är att läsa
mink-analyses, standard-analyses-swe readability measures text svenska
swe-readability-sparv-nk
Annotering av svenska texter med NK-värden som indikerar hur lätt eller svår en text är att läsa
mink-analyses, standard-analyses-swe readability measures text svenska
swe-readability-sparv-ovix
Annotering av svenska texter med OVIX-värden som indikerar hur lätt eller svår en text är att läsa
mink-analyses, standard-analyses-swe readability measures text svenska
swe-sbx-ocr-correction-viklofg-sweocr
Annotering av OCR-korrigeringar.
ocr-correction
swe-sbx-word-prediction-kb-bert
Annotering av ord-predikation för varje text i en text.
word-prediction token
swe-sense-sparv-saldo
Uppslagning som ger SALDO-identifierare
lexical lookup token svenska
swe-sense-wsd
Ordbetydelsedisambiguering baserad på annotering i SALDO
mink-analyses, standard-analyses-swe sense disambiguation token svenska
swe-sentence-punkt-storsuc
Meningssegmenterar text, specialanpassad för svenska
mink-analyses, standard-analyses-swe sentence segmentation sentence svenska
swe-sentiment-sparv-sensaldo
Sentimentanalys via uppslag i SenSALDO-lexikonet
mink-analyses, standard-analyses-swe sentiment analysis token svenska
swe-tokenization-sparv-betterword
Tokeniserar text, specialanpassad för svenska
mink-analyses, standard-analyses-swe tokenization token svenska
tokenization-sparv-blanklines
Tokeniserar text utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
tokenization token
tokenization-sparv-linebreaks
Tokeniserar text utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
tokenization token
tokenization-sparv-whitespace
Tokeniserar text utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
tokenization token