Alimentation et consolidation d’une BD d’images astronomiques intégrant des métadonnées. Optimisation des requêtes SQL
Le CDS est un acteur majeur de l’Observatoire virtuel astronomique (
http://www.ivoa.net). A ce titre il participe au développement de nombreux standards d’échanges de données et d’accès à des services en ligne, tout en développant des applications compatibles. Actuellement le CDS participe entre autres au développement du modèle de données Provenance (de l’IVOA).
http://www.ivoa.net/documents/ProvenanceDM/20181015/PR-ProvenanceDM-1.0-20181015.pdf
Il s'agit de fournir pour un jeu de données, l’initiateur (Agent), la tâche (Activity), et les fichiers de données source (Entity). Ce modèle est implémenté dans une base de données prototype. Cette base permet de déduire des informations sur l’histoire d’un fichier de données, des critères de qualité, et éventuellement de re-calibrer ces données en rejouant les scénarios décrits. La base de données est accessible à distance au travers d’un service conforme au protocole d’échanges (TAP) le plus courant pour les observations en astronomie.
Nous souhaitons enrichir le contenu de la base avec d'autres types de données et de traitements que ceux actuellement opérationnels, pour prolonger les « historiques » des données. Ceci nécessite d'aller récupérer des informations enregistrées sous des formats variés et dispersées dans différents containers qui seront indiqués au stagiaire par les maîtres de stage.
Il faudra donc développer divers programmes en Python permettant de les extraire et de les mettre en forme pour intégration à la base de données.
Une fois cette tâche réalisée, on pourra jouer des scénarios d'interrogations plus ou moins complexes et définir des fonctions qui permettent d'en faciliter l'usage par des utilisateurs moins familiers avec SQL.
Connaissances souhaitées : Python, connaissances en base de données, langage SQL, UML, lecture de l’anglais.