Tags:
create new tag
, view all tags

Djin2

Lien vers l'application

http://cdsdjin/

Avancement

Installation

Djin2 est composé d'une partie serveur mettant à disposition un webservice.
Il comporte également une partie client avec des applications web : djin-client et djin-client-admin.
Pour installer Djin2, suivez les instruction d'Installation.

Technologies

Serveur / Webservice

Java (javax.ws)

Java a été choisi notamment pour des raisons de maintenance, c'est le langage le plus utilisé à l'Observatoire.
Ce choix est également motivé par la compatibilité avec la librairie Grobid, qui a une place importante dans ce projet.

Grobid

[...]

Clients

Angular2

Pourquoi une application web plutôt qu'une application desktop ?

  • Développement plus rapide ;
  • Ré-utilisabilité de certains éléments pour d'autres applications web (pour mettre à disposition des documents traités par exemple) ;
  • Adapté à l'utilisation des documentalistes, où le navigateur web a une place importante (à vérifier).

Fonctionnement

Entraînement et Apprentissage

Pour détecter automatiquement des objets astronomiques dans un document, Djin2 utilise la librairie Grobid.
La détection est réalisée à partir d'un modèle probabiliste généré lors d'une phase d'apprentissage.
Afin de comprendre son fonctionnement et son intégration dans Djin2, rendez vous à Entraînement et Apprentissage.

Configuration et Performances

Performances

Pour la recherche d'objets astronomiques dans un document :

- Document PDF :
La phase qui prend le plus de temps est pdf2Xml et fullTextProcess.
La taille du model entraîné n'a que peu d'importance.

Configuration

Grobid consomme essentiellement du CPU. Un nombre élevé de thread augmente la rapidité de traitement.
Un stockage SSD performant améliore la rapidité de traitement de pdf2Xml.
La RAM, quant à elle, a moins d'importance, 8 Go de RAM dédiées sont suffisantes.

Topic revision: r13 - 2017-09-28 - VincentKaestle2
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2024 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback