Tags:
create new tag
, view all tags

Compte-rendu provisoire de la réunion chercheurs du 15 mai 2012

Participants : Mark A., Caroline B., Laurent C., Sébastien D., Françoise G., Cécile L., Pierre O., François O., Arnaud S., Bernd V.

Cette réunion est un "brain storming" des chercheurs du CDS sur les aspects scientifiques. Elle permettra de nourrir les réunions stratégie (qu'elle ne remplace évidemment pas) en faisant en particulier émerger des sujets, et de discuter et organiser l'implication des chercheurs dans les actions où il faut leur participation. La réunion a été précédée d'un appel à idée. La discussion a été focalisée sur une série de thèmes. Les discussions techniques ne sont pas du ressort de cette réunion.

Des sujets très différents ont été abordés. Certains sont d'ordre général, impliquant des projets à long terme, et seront repris en réunion stratégie; d'autres sont à plus court terme. Lors de l'opération hiérarchie dans Simbad, tous les chercheurs s'étaient impliqués dans les réunions et discussions. Cette méthode est trop lourde par rapport à notre charge de travail. Pour chaque sujet une partie des chercheurs s'est porté volontaire pour la mise en place et le suivi. La prochaine réunion pourrait avoir lieu fin juin ou début juillet, mais il est souhaitable qu'une réunion stratégie et une réunion de suivi aient eu lieu auparavant.


I. Questions d'ordre général

I.1. Nouvelles pages d'accueil du CDS

Il y a encore des pages à reprendre avant de les rendre publiques, en particulier les pages : "Help", "Tutorials", et "Publication support". Une réunion type brain storming sera organisée par Françoise (mercredi 13 juin à 10h).

I.2. Future of scientific publishing

De plus en plus, il existe une pression, voire une obligation, à ce que les chercheurs rendent leurs données publiques le plus rapidement possible. Ce phénomène touche toutes les disciplines et génère des discussions au niveau des institutions et des journaux. Certains grands éditeurs proposent de s'en occuper; on propose aussi de créer de grands réservoirs de stockage de données (sans valeur ajoutée). Comme identifié dans son plan stratégique, le CDS doit maintenir et faire valoir son savoir-faire en la matière à tous les niveaux (data, images), en partenariat avec les différents acteurs du VO, et en insistant sur la valeur ajoutée qui permet d'extraire facilement les données pertinentes pour chaque projet. Ce thème est régulièrement évoqué en réunion stratégie.

I.3. Understanding of the scientific needs of the users

Savons-nous vraiment quels sont les besoins scientifiques des utilisateurs ? Ce n'est pas évident. On pourrait envisager de réaliser une enquête utilisateurs, éventuellement en s'inspirant des user surveys de l'ESO. Les trois services devraient être inclus. L'idéal serait plutôt un questionnaire en ligne qui pourrait d'abord être testé par mail auprès des membres de la SF2A. C'est un projet à long terme qui devrait être à nouveau discuté en réunion stratégie et avec le conseil scientifique du CDS. Hormis la conception du questionnaire, qui n'est pas évidente, le travail de dépouillement et d'analyse sera un gros travail.

I.4. Dimension temporelle des données

Il y a de plus en plus de séries temporelles, ou d'observations répétées (on pense à GAIA, LSST, mais aussi à des surveys répétés deux fois comme SAGE, etc...). L'information, quand elle existe, est normalement stockée dans les headers des images Aladin; par contre elle n'est pas forcément accessible aux utilisateurs d'Aladin. Concernant les catalogues Vizier, si l'information existe dans les données originales elle est conservée dans Vizier et accessible. Il peut par contre exister un problème d'homogénéïté des définitions des JD sur lequel le CDS pourrait intervenir. Au niveau de Simbad, le JD pourait être conservé dans un certain nombre des champs de mesures. Cela demanderait néanmoins une modification plusieurs formats de mesures.


II. Questions liées à Vizier

II.1. Priorités des journaux dans Vizier.

Malgré l'effort constant et assidu de Patricia, Emmanuelle, et François O., le nombre de tables continue à augmenter. Etant donné que AJ prépare en partie le travail pour l'intégration des tables au CDS, et que c'est un journal surtout centré sur les observations, AJ aura la priorité par rapport à MNRAS, sauf si les auteurs ont envoyé leur table directement au CDS.

II.2. SEDs

Une bonne partie est en place mais il reste encore des ajustements à faire. Il faudrait aussi que la table des filtres et des missions soit accessible aux utilisateurs.

Points de contact : Mark, François O., Bernd, Sébastien.


III. Questions liées à Simbad

III.1. Informations statistiques sur les objets dans les références

Nous pensons que les informations statistiques peuvent maintenant être rendues publiques, avec une note d'explication pour les utilisateurs.

Une réunion est organisée par Soizick et Anais le 15 juin 2012 à 10h. Elle portera sur la pertinence du tri des références dans Simbad en fonction de ces informations statistiques. Pour info, les informations statistiques portent sur la présence du nom de l'objet dans :

  • titre (t)
  • abstract (a)
  • mot-clés (k)
  • figures (f)
  • légendes (c)
  • texte (x)
  • tables (d)
  • sous-titres (s) (paragraphes)
  • objet taggé (o)
  • objet implicite (z)
  • calibrateur (?)

Le nombre d'occurence du nom de l'objet est le nombre total de fois où il apparait dans l'article quel que soit l'endroit. Ces statistiques sont faites régulièrement par DJIN depuis 2008. Pour les références antérieures un rattrapage a été effectué sur les titres, et par mot-clés seulement pour les références entrées automatiquement. Il existe d'autres variables sur lesquelles on peut jouer, la date en particulier.

III.2. Nouveau Raccord

C'est Anais qui fait le développement. Le cadre est en place, Anais s'attaque maintenant aux algorithmes en partant de la version de François O. Il faudra prévoir une ou plusieurs réunions de travail qui impliquent non seulement Anais et François, mais aussi les documentalistes qui utilisent Raccord, et certains chercheurs (Bernd, Arnaud, Cécile, Françoise, ...). Un document qui explicite le Raccord actuel (critères et calcul du score) serait plus qu'utile.

III.3. Liens d'associations

On en parle depuis à peu près aussi longtemps que les liens hiérarchiques. C'est néanmoins beaucoup plus simple que la hiérarchie puisqu'il suffit de connecter des objets deux à deux.

Points de contact :Bernd et Sébastien.

III.4. Conservation des positions

C'est aussi un sujet qui revient très régulièrement : conserver toutes les coordonnées d'un objet en lien avec son identificateur. Pour l'instant on perd les coordonnées précédentes chaque fois qu'on les change en DF. Il existe deux champs de mesures : pos et posa :

pos | alpha delta |me.al me.de|equi epoch | reference |

posa | alpha delta | MajAxis, MinAxis PA |equi epoch | reference |

Il faudrait les unifier, re-réfléchir à ce qu'il est utile de conserver. Dans tous les cas trois champs devront être ajoutés par rapport aux deux formats actuels : ID, JD, et lien Vizier si il y a lieu.

Points de contact : Arnaud et Cécile.

-- CecileLoup - 11 Jun 2012

Topic revision: r3 - 2012-06-12 - CecileLoup
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2024 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback