Hoppa till huvudinnehåll
Språkbanken Text är en avdelning inom Språkbanken.

Analyser

Här kan du söka bland våra analyser. Du klickar på en rad för att få fram mer information.
Analys Sortera fallande Typ Samlingar Uppgift Enhet Språk
eng-dependency-stanza
Dependensparsning med Stanzas standardmodell för engelska
Analys dependency parsing token engelska
eng-lemmatization-stanza
Lemmatisering med Stanzas standardmodell för engelska
Analys lemmatization token engelska
eng-msd-stanza-ufeats
Morfologisk analys för engelska med universal features (UD) baserad på Stanza
Analys morphosyntactic tagging token engelska
eng-namedentity-stanza
Namnigenkänning (NER) med Stanzas standardmodell för engelska
Analys named entity recognition engelska
eng-pos-stanza
Annotering av ordklasser (Penn Treebank-taggar) med Stanzas standardmodell för engelska
Analys part-of-speech tagging token engelska
eng-pos-stanza-upos
Annotering av UD-ordklasser (universal dependencies) med Stanzas standardmodell för engelska
Analys part-of-speech tagging token engelska
eng-sentence-stanza
Meningssegmentering med Stanzas standardmodell för engelska
Analys sentence segmentation sentence engelska
eng-tokenization-stanza
Tokenisering med Stanzas standardmodell för engelska
Analys tokenization token engelska
export-conllu
Export av korpusdata i Språkbanken Texts CoNLL-U-format
Hjälpverktyg export
export-xml-preserved
XML-korpusexport som bevarar formateringen från källfilen
Hjälpverktyg export
export-xml-pretty
XML-korpusexport där varje token skrivs på en egen rad
Hjälpverktyg export
export-xml-scrambled
XML-korpusexport med omkastat innehåll
Hjälpverktyg export
Samling
mink-analyses
Samling av analyser som används i Mink
Analys, Samling svenska
paragraph-sparv-blanklines
Segmenterar text i stycken utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
Analys tokenization paragraph
paragraph-sparv-linebreaks
Segmenterar text i stycken utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
Analys paragraph segmentation paragraph
paragraph-sparv-whitespace
Segmenterar text i stycken utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
Analys paragraph segmentation paragraph
sentence-punkt
Segmenterar text i meningar utifrån skiljetecken med hjälp av NLTKs RegexpTokenizer
Analys sentence segmentation sentence
sentence-sparv-blanklines
Segmenterar text i meningar utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
Analys tokenization sentence
sentence-sparv-linebreaks
Segmenterar text i meningar utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
Analys sentence segmentation sentence
sentence-sparv-whitespace
Segmenterar text i meningar utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
Analys sentence segmentation sentence
Samling
standard-analyses-swe
Samling av Sparv-analyser för modern svenska
Analys, Samling svenska
swe-compound-sparv-saldolemgram
Analys av sammansatta SALDO-lemgram inklusive sannolikhetsrankning
Analys mink-analyses, standard-analyses-swe compound analysis token svenska
swe-compound-sparv-saldowords
Analys av sammansatta SALDO-ordformer
Analys mink-analyses, standard-analyses-swe compound analysis token svenska
swe-dependency-malt-treebank
Svensk dependensparsning tränad på Svensk trädbank baserad på MaltParser
Analys dependency parsing token svenska
swe-dependency-stanza-stanzasynt
Svensk dependensparsning tränad på Svensk trädbank med Stanza
Analys mink-analyses, standard-analyses-swe dependency parsing token svenska
swe-geotagcontext-sparv
Annotering av texter med platsinformation, baserad på platser som finns i texten
Analys standard-analyses-swe geotagging text svenska
swe-geotagmetadata-sparv
Annotering av texter med platsinformation, baserad på platser som finns i texten
Analys geotagging text svenska
swe-lemgram-sparv-saldo
Uppslagning som ger SALDO-lemgram
Analys mink-analyses, standard-analyses-swe lexical lookup token svenska
swe-lemmatization-sparv-saldo
Fullformsuppslagning som ger SALDO-grundformer
Analys lemmatization token svenska
swe-lemmatization-sparv-saldo2
SALDO-grundformer plus analys av sammansättningar bestående av SALDO-ingångar
Analys mink-analyses, standard-analyses-swe lemmatization token svenska
swe-lemmatization-stanza-stanzalem
Annotering av grundformer (lemman) med Stanza för svenska tränat på SUC3
Analys lemmatization token svenska
swe-lexical_classes_text-sparv-blingbring
Lexikala klasser från Blingbring på textnivå
Analys mink-analyses, standard-analyses-swe lexical classes text svenska
swe-lexical_classes_text-sparv-swefn
Lexikala klasser från SweFN på textnivå
Analys mink-analyses, standard-analyses-swe lexical classes text svenska
swe-lexical_classes_token-sparv-blingbring
Lexikala klasser från Blingbring på tokennivå
Analys mink-analyses, standard-analyses-swe lexical classes token svenska
swe-lexical_classes_token-sparv-swefn
Lexikala klasser från SweFN på tokennivå
Analys mink-analyses, standard-analyses-swe lexical classes token svenska
swe-msd-hunpos-suc3
Annotering av morfosyntaktiska deskriptorer (SUC) med Hunpos för svenska
Analys morphosyntactic tagging token svenska
swe-msd-hunpos-suc3-1800
Annotering av morfosyntaktiska deskriptorer (SUC) med Hunpos för 1800-talssvenska
Analys morphosyntactic tagging token svenska
swe-msd-stanza-stanzamorph-suc3
Annotering av morfosyntaktiska deskriptorer (SUC) med Stanza för svenska
Analys mink-analyses, standard-analyses-swe morphosyntactic tagging token svenska
swe-msd-stanza-stanzamorph-ufeats
Morfologisk analys för svenska med universal features (UD) baserad på Stanza
Analys mink-analyses, standard-analyses-swe morphosyntactic tagging token svenska
swe-namedentity-swener
Namnigenkänning känner igen och förser namn och namnliknande uttryck (s.k. entiteter) i löpande text med fördefinierade etiketter, som organisation, person eller plats.
Analys mink-analyses, standard-analyses-swe named entity recognition svenska
swe-phrasestructure-sparv
Svensk frasstrukturparsning baserad på Mamba-Dep dependensanalys
Analys phrase structure parsing svenska
swe-pos-hunpos-suc3
Annotering av SUC-ordklasser med Hunpos för svenska
Analys part-of-speech tagging token svenska
swe-pos-hunpos-suc3-1800
Annotering av SUC-ordklasser med Hunpos för 1800-talssvenska
Analys part-of-speech tagging token svenska
swe-pos-stanza-stanzamorph
Annotering av SUC-ordklasser med Stanza för svenska
Analys mink-analyses, standard-analyses-swe part-of-speech tagging token svenska
swe-readability-sparv-lix
Annotering av svenska texter med LIX-värden som indikerar hur lätt eller svår en text är att läsa
Analys mink-analyses, standard-analyses-swe readability measures text svenska
swe-readability-sparv-nk
Annotering av svenska texter med NK-värden som indikerar hur lätt eller svår en text är att läsa
Analys mink-analyses, standard-analyses-swe readability measures text svenska
swe-readability-sparv-ovix
Annotering av svenska texter med OVIX-värden som indikerar hur lätt eller svår en text är att läsa
Analys mink-analyses, standard-analyses-swe readability measures text svenska
swe-sbx-ocr-correction-viklofg-sweocr
Annotering av OCR-korrigeringar.
Analys ocr-correction
swe-sbx-word-prediction-kb-bert
Annotering av ord-predikation för varje text i en text.
Analys word-prediction token
swe-sense-sparv-saldo
Uppslagning som ger SALDO-identifierare
Analys lexical lookup token svenska
swe-sense-wsd
Ordbetydelsedisambiguering baserad på annotering i SALDO
Analys mink-analyses, standard-analyses-swe sense disambiguation token svenska
swe-sentence-punkt-storsuc
Meningssegmenterar text, specialanpassad för svenska
Analys mink-analyses, standard-analyses-swe sentence segmentation sentence svenska
swe-sentiment-sparv-sensaldo
Sentimentanalys via uppslag i SenSALDO-lexikonet
Analys mink-analyses, standard-analyses-swe sentiment analysis token svenska
swe-tokenization-sparv-betterword
Tokeniserar text, specialanpassad för svenska
Analys mink-analyses, standard-analyses-swe tokenization token svenska
tokenization-sparv-blanklines
Tokeniserar text utifrån tomma rader med hjälp av NLTKs RegexpTokenizer
Analys tokenization token
tokenization-sparv-linebreaks
Tokeniserar text utifrån radbrytningar med hjälp av NLTKs RegexpTokenizer
Analys tokenization token
tokenization-sparv-whitespace
Tokeniserar text utifrån blanktecken med hjälp av NLTKs RegexpTokenizer
Analys tokenization token