Tags:
create new tag
, view all tags

Interrogation de services de données astronomiques en Langage Naturel

Les services du CDS sont actuellement essentiellement interrogeables au travers de "formulaires" classiques (exemple : pour rechercher des catalogues astronomiques, on donnera par exemple un nom d'objet astronomique ou une position dans le ciel, un rayon, ..., des paramètres pour formater le résultat (par exemple les 50, 100, ... premiers ou illimité, le format de la sortie (HTML, CSV, XML, etc.)). Nous prototypons actuellement un outil permettant à un utilisateur de réaliser une requête en langage naturel (exemples : " What is the effective temperature of Sirius ? ", " What is the redshift of galaxies members of the Virgo cluster ? "). Cela peut concerner un seul service ou plusieurs. Nous avons des outils permettant de reconnaître par exemple des noms d'objets astronomiques dans un texte. Nous avons également exploré les outils proposés par Stanford (autour du " Natural Language Processing "). Nous avons aussi défini une première liste d'exemples de requêtes. Nous avons déjà investigué le champ de la réalité virtuelle et ce type d'interaction pourrait être également très utile dans un domaine où l'interface utilisateur est extrêmement réduite. On peut alors envisager d'y associer une reconnaissance vocale. Il y a encore beaucoup de choses à faire et à améliorer avant une mise en ligne. Notamment dans le cas des requêtes difficiles à interpréter, car soit ambiguës soit mal formulées (pour diverses raisons, mauvaise connaissance du domaine, première utilisation). Il n'est pas possible de laisser un utilisateur se débrouiller seul sans lui apporter une aide (en plus de la documentation en ligne habituelle) durant la saisie afin de réduire les risques d'échec et lui permettre également de comprendre pourquoi sa requête n'aboutit pas au résultat espéré. Cette aide peut intervenir et se concrétiser à divers niveaux, durant la saisie (complétion / propositions par exemple), après la saisie par reconstruction (correction de fautes d'orthographe, mots manquants, unité des valeurs numériques, etc.) de la requête.

Connaissances souhaitées : goût pour les aspects R&D, rigueur, un langage de programmation (à priori parmi Java, Python et/ou JavaScript, …) suivant les technologies utilisées.

Topic revision: r1 - 2018-04-02 - AndreSchaaff
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2024 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback