L'objet de ce projet était de réaliser la conception d'une chaîne de traitement semi-automatique de fichiers PDF hétérogène pour permettre la recherche de texte dans le contenu même des fichiers. La conception de la chaîne a été scindée en plusieurs chantiers : Pré-qualifications des PDF fonctions de leur contenu initial (Scan Pur, Présence annotations, Signets, [...]