Améliorer le code Java de COSIM (Comparison of Objects for SIMbad) pour enregistrer l'état et accélérer la prise en compte opérationnelle
SIMBAD est un service de référence du CDS largement utilisé par la communauté astronomique internationale. Il propose des informations pour plusieurs millions d'objets célestes. La base de données associée n'est pas figée et elle est mise à jour régulièrement. En effet, une équipe de 8 documentalistes l'enrichit et utilise pour cela des logiciels spécifiques pour vérifier l'intégrité des données au moment des insertions.
La quantité de données à intégrer est de plus en plus importante et le temps de répercussion au niveau du service opérationnel doit suivre. Une amélioration possible serait de mettre en oeuvre un système de cache pour les données déjà existantes dans la base pour un travail donné et de pouvoir les réutiliser à chaque action sur ces données.
Le stage consiste à modifier un logiciel écrit en Java pour le traitement de milliers de données afin qu'il enregistre (via la sérialisation Java) un cache lors du premier traitement et puisse le réutiliser par la suite au lieu de réinterroger la base de données. Cela impliquera également des tests de performance.
Connaissances souhaitées : Java, Sérialisation, threads