Skip to content

Latest commit

 

History

History
8 lines (4 loc) · 755 Bytes

README.md

File metadata and controls

8 lines (4 loc) · 755 Bytes

Extraction d'un corpus

Ce chapitre fait l'inventaire des différentes méthodes permettant d'extraire un corpus de documents correspondant à une requête.

Tous ces outils proposent de télécharger un corpus de fichiers de textes intégraux (PDF, TEI, TXT, etc.), de fichiers de métadonnées (Mods, XML) ou de fichiers d’enrichissement (TEI) depuis la base ISTEX à partir d’une requête. Pour plus de détails sur les différents formats et types de fichiers, n'hésitez pas à consulter la rubrique correspondante en annexe.

Pour appréhender les usages avancés de l'API, vous pouvez aussi consulter le tutoriel prévu à cet effet.