Hoppa till huvudinnehåll

Arabisk e-bokskorpus

Datacitering Information

Språkbanken Text (2025). Arabisk e-bokskorpus (uppdaterad: 2025-09-12). [Data set]. Språkbanken Text. https://doi.org/10.23695/xwz6-jv19
BibTeX Ytterligare sätt att citera datamängden.
En samling av 1 745 böcker på arabiska.

Arabisk e-bokskorpus är en fritt tillgänglig samling av 1 745 böcker på arabiska, publicerade av Hindawi Foundation mellan 2008 och 2024. Böckerna är av olika genrer, bland annat, facktext, romaner, barnlitteratur, poesi och pjäser.

För ytterligare detaljer, se Hallberg, A. (2025). An 81-million-word multi-genre corpus of Arabic books. Data in Brief, 60, 111456.

Korpusen finns även tillgänglig för nedladdning i HTML-format och icke-formaterad ren text.

Tillgänglig via

Åtkomst Plattform Licens
CC-BY-4.0

Ladda ned

Fil Storlek Modifierad Licens
arabic-ebooks.xml.bz2
corpus Information (XML, omkastad)
142.88 MB 2025-09-12 CC-BY-4.0

Typ

  • Korpus

Språk

arabiska

Storlek

Token: 76 486 597
Meningar: 3 629 107

Skapad

2025-09-12

Updaterad

2025-09-12

Kontakt

sb-info@svenska.gu.se