Hoppa till huvudinnehåll

Arabisk e-bokskorpus

Datacitering Information

Språkbanken Text (2025). Arabisk e-bokskorpus (uppdaterad: 2025-09-12). [Data set]. Språkbanken Text. https://doi.org/10.23695/xwz6-jv19
BibTeX Ytterligare sätt att citera datamängden.
En samling av 1 745 böcker på arabiska.

Arabisk e-bokskorpus är en fritt tillgänglig samling av 1 745 böcker på arabiska, publicerade av Hindawi Foundation mellan 2008 och 2024. Böckerna är av olika genrer, bland annat, facktext, romaner, barnlitteratur, poesi och pjäser.

För ytterligare detaljer, se Hallberg, A. (2025). An 81-million-word multi-genre corpus of Arabic books. Data in Brief, 60, 111456.

Korpusen finns även tillgänglig för nedladdning i HTML-format och icke-formaterad ren text.

Tillgänglig via

Åtkomst Plattform Licens
CC BY 4.0

Ladda ned

Fil Storlek Modifierad Licens
arabic-ebooks.xml.bz2
this file contains a scrambled version of the corpus Information (XML)
142.88 MB 2025-09-12 CC BY 4.0

Typ

  • Korpus

Språk

arabiska

Storlek

Meningar: 3 629 107
Token: 76 486 597

Skapad

2025-09-12

Updaterad

2025-09-12

Kontakt

sb-info@svenska.gu.se