Tags:
create new tag
, view all tags

CR de la réunion DOI VizieR (02/05/2016)

Participants: G.Landais, M.Brouty, E.Perret, S.Guehenneux, M.Allen, T.Boch, S.Lesteven

Le sujet de la réunion est de donner des réponses aux questions suivantes:

  • Qu'est ce qu'un DOI VizieR ?
  • Granularité des DOI dans VizieR ?
  • Choix des méta-données dans VizieR ?
  • Que mettre dans la landing page VizieR ?
  • Que choisir comme nom DOI ?
  • Quelles actions ?

Préambule

L'équipe VizieR part sur le postulat d'un service de création de DOI entièrement automatisé.

  • l'ensemble des méta-données fournies pour la création d'un DOI doit être inluse dans les méta-données VizieR (ReadMe, base de données, fichier .status)
  • L'ensemble des méta-données DOI non incluses à ce jour dans les méta-données VizieR devront l'être.
    L'ensemble de ces méta-données recensées sont:
    • l'identifiant auteur ORCID
    • l'identifiant DOI des articles, fournies par les publishers
Documents annexes:

Qu'est ce qu'un DOI VizieR

Status: proposition de définition VizieR -

Le DOI VizieR est destiné à la citation de données VizieR. Ce qui inclus:

  • les données : tables/catalogues/données associées
  • les méta-données ainsi que les valeurs ajoutées: graphe, liens, ...
  • les services d'accès: pages web VizieR, FTP, protocoles VO, etc.
Note: dans le cas des tables, ce sont les tables VizieR et non pas les tables originales qui sont référencées par le DOI (celles-ci peuvent être un peu différente: précision, colonnes positionnelles ajoutées, ..)

Granularité des DOI dans VizieR ?

Status: dans un premier temps, la granularité choisie est au niveau catalogue.

Possibilité d'attribution de DOI:

  • sur les services : site web VizieR. Doit on aussi ajouter les services TAPVizieR, données associées , FTP, Hips?
  • sur les catalogues : il s'agit du niveau de granularité actuel du registre de l'IVOA
  • sur les tables : il s'agit du niveau de granularité que l'on souhaite aujourd'hui à l'IVOA
  • sur toutes les données associées : images, spectres.. ?
Quelques remarques quant au choix de la granularité au niveau table:
  • elle permet de citer et de lier des tables depuis un article - c'est une alternative généralisée au lien "Table at CDS" que l'on voit sur le site web A&A ou ADS
  • l'analogie avec la granularité voulue dans le registre IVOA n'est pas évidente:
    Le registry IVOA est axé interrogation : son niveau de granularité se situe au niveau table car ces protocoles d'accès sont au niveau table. Le DOI se consacre lui à la citation.
  • Les tables d'un catalogues peuvent être modifiées aujourd'hui, même s'il s'agit d'actions rares.
    Un exemple d'action est la fusion de 2 tables en une seule.
    Or la disparition d'accès à une table est contraire au DOI. Ainsi, la granularité au niveau table nécessite un changement dans la gestion des modifications des données VizieR publiées (par exemple ajouter un délai de latence ou alors ne pas supprimer les tables déja publiées)
  • Emmanuelle : Nous avions aussi parlé du fait que les tables n'ont pas de mots-clefs associés directement récupérables (à part peut-être via les UCDs ?) ce qui impliquera de revoir les métadonnées associées à un DOI de type table...
Nous nous sommes mis d'accord, sur la création des DOI suivants:
  • DOI sur le service VizieR
  • DOI sur les catalogues
  • [éventuellement dans le futur] DOI sur les tables

Choix des méta-données dans VizieR ?

Status: choix de méta-données à compléter.

Le DOI VizieR:

Schema: datacite-example-vizier-service.xml

Suggestions de méta-données DOI:

  • Alternate identifiers: l'URL vizieR
  • Related identifiers: bibcode+DOI de l'article de référence VizieR
  • page licences+aknowledgments
  • ... (voir fichier XML)
A déterminer:
  • les mots clés du service VizieR (dans l'exemple: astronomy, Database, Catalogue, Data Center)
  • les contributeurs: faut il ajouter le directeur du CDS ? autres personnes ?
  • ajout du contact Question ?
    Note: je n'ai rien vu qui ressemble à une adresse mail dans le document concernant le schema XML.....?????
  • la description VizieR ?
Le DOI catalogue

Exemple de schema: : datacite-example-vizier-cat-eoldie.xml

Notes générales:

  • on ne mettra pas d'ORCID pour les auteurs secondaires
  • on ne mettra pas d'affiliation pour les auterus
  • on évite d'ajouter des liens vers des services locaus ou externes. On préfère, pour des raisons de maintenances, ajouter ces liens (par exemple page site web des données associées) dans la "landing page".
Suggestions de méta-données DOI:
  • auteurs + co-auteurs
  • titre + sous titre (présent dans le ReadMe)
  • publicationYear (ReadMe)
  • mots clés généraux + ADC_keywords (définit par VizieR, page http://cdsarc.u-strasbg.fr/doc/ADCkwds.htx)
  • contributeurs ?
  • identifiants alternatifs:
    • nom du catalogue VizieR
    • IVO ID
  • identifiants relatifs:
    • bibcode
      Note: le bibcode peut être modifié (il s'agit la plupart du temps de la denière lettre concernant l'auteur)
    • DOI publisher si existant
      Note: le DOI publishers n'existe peut être pas pour certain grand catalogue
  • format: liste fixe; VOTable, Text/CSV, Fits, HTML
  • page fixe de licences/aknowledgments de VizieR : http://cds.u-strasbg.fr/vizier-org/licences_vizier.html
  • la description: on utilisera plutôt la description du ReadMe que l'abstract
Emmanuelle : Petite remarque pour "titre" et "sous-titre" : le Short Title (1er titre en haut du ReadMe, après la référence du Catalogue) est le titre ajouté par les documentalistes (vérifié par les astronomes) qui correspond au catalogue. Le titre long est celui repris tel quel de la publication et ne décrit pas toujours ce qu'il y a dans les tables... Du coup, si par "sous-titre", on parle du Short Title, ce serait plutôt celui qu'il faudrait garder et on pourrait se passer du titre (à voir si cela est vrai pour les catalogues qui ne sont pas liés à une publication).

Pour les mots-clefs généraux, on pourrait reprendre ceux définis pour le service VizieR ?

Notes sur la modification du bibcode:

Le bibcode peut être modifié :

  • changement d'auteur qui modifie la dernière lettre du bibcode (cas le plus fréquent).
  • Changement plus profond (changement de pages...) qui implique la création et l'invalidation d'un nom VizieR
Dans tous les cas, le catalogue est ré-ingeré dans le système VizieR, l'attribution DOI ou la modification sera exécuté par le script d'ingestion VizieR et pourra donc prendre en compte les modifications.
Il serait apprécier dans le cas de changement "profond" que le nom DOI soit indépendant du nom du catalogue. Cependant , dans ce cas, il faudra un mécanisme pour conserver le nom DOI précédemment créé!

A déterminer:

  • identificant IVOA : que mettre comme valeur à alternateIdentifierType ? "IVOID", "IVOA ID", "ID" ??
  • stratégie pour le cas de cangement de nom catalogue. (Note: un ajout dans le fichier .status devrait faire l'affaire)
  • les droits: aut il prendre en compte le Copyright (tres rare dans VizieR) que l'on peut trouver dans le ReadMe ?
  • pour la description: si l'on met la zone "description" de VizieR plutôt que l'abstract, il faudra peut etre modifier (cf fichier XML) la propriété descriptionType = "abstract" ? ou "other"?
  • les contributeurs ?
    La question est de savoir ce que l'on souhaite faire apparaitre dans le pipeline de création des données:
    Quelles contributeurs doivent apparaitre: auteur --> editeur --> publisher --> curateur (=CDS) ??? autres ??? (voir la liste dans le document pdf http://schema.datacite.org/meta/kernel-3/doc/DataCite-MetadataKernel_v3.1.pdf)
    (voir exemple commenté dans le fichier XML)

Que mettre dans la landing page VizieR ?

Status: proposition de landing page

Actuellement la page la plus proche de la landing page serait la page "brief Summary" : ex: http://csdarc.u-strasbg.fr/viz-bin/Cat?II/246.

Nous sommes d'avis :

  • la landing page nécéssite des informations(listées ci dessous) différentes de la page "brief summary"
  • il est préférable que les service d'accès aux données soient gérés au niveau du service ou de la landing page plutot que dans les métadonnées DOI
Liste des informations à présenter sur la page:
  • Le titre du catalogue
    A préciser : le titre court? ou le titre long ? (Emmanuelle : même remarque que ci-dessus)
  • l'auteur principal avec son ORCID si connu par ADS
    Note: la résolution auteur -ADS se ferait par le service ADS.
  • les auteurs secondaires (éventuellement caché par défaut dans la page - La règle biblio est de citer 3 auteurs max. )
  • les dates d'ingestion dans VizieR et la date de dernière modification (dans VizieR également)
  • les identifiants:
    • le nom du catalogue VizieR (avec lien vers les données VizieR)
    • le bicode et le DOI de publication si connus (Renvois vers ADS ET la publication ?)
    • l'IVOID du VO
  • la section "Description" du ReadMe ou le cas échéant l'abstract
    Note: la description est un + VizieR, faisant parti des données enrichies par VizieR
  • un lien générique vers la page de licence/acknowledgment VizieR http://cds.u-strasbg.fr/vizier-org/licences_vizier.html
  • un lien vers les données associées s'il en existe
  • On n'avait pas parlé d'un lien vers les tables ?
Eventuellement, on pourra y ajouter: (les point suivant sont ouverts quant a leurs pertinence sur la page)
  • la "coverage map" VizieR
  • un texte Copyright ou Aknowledgment dédié (ex catalogue GSC)
  • un lien vers le repository FTP
Les informations suivantes n'ont PAS été retenues:
  • mots clés VizieR
  • MOC, TAPVizieR, HIPs ...
  • liens vers les données originales ou centre producteurs des données (exemple données venant de centre spaciaux)
  • Les URL vers les centres spaciaux (producteurs des données) sont généralement indiquées dans le ReadMe.
    Cette information n'est pas scriptable aisément, mais la volumétrie de ces catalogues est limitée qui implique un surplus d'une intervention "manuelle" mais limitée.
    De plus, les URL extrernes peuvent changer?
    Y a t'il cependant des raisons "politiques" qui pousserait à ajouter ces URL?

Que choisir comme nom DOI ?

Satus: proposition de la création de DOI avec des noms "opaques"

DOI: <prefix>/<suffix>

  • Le préfixe est attribué par DataCite
  • le suffixe est donnépar le CDS
Exemples: pour le catalogue II/246 (=2mass) (YYYYY: le préfixe attribué par DataCite)
  1. suffixe entièrement "opaque": YYYYY/1246
  2. suffixe semi "opaque" : YYYYY/CDS/VizieR.1246
  3. suffixe basé sur le nom de catalogue VizieR: YYYYY/CDS/VizieR/II/246

DataCite incite les publishers de DOI à utiliser un suffixe suffisament opaque. La solution que nous (Gilles, Thomas, Soizick, Marianne, Emmanuelle) préconisons est la solution semi-opaque.
Cela permet de nous affranchir de changement de nom VizieR, comme par exemple le passage d'un catalogue B (aux données qui évoluent) en un catalogue aux données figées (ex: catalogue CoRoT).

Exemple de DOI : YYYYY/CDS/VizieRxxxxxxxx

où:

  • YYYYY: le préfixe attribué au CDS par DataCite
  • xxxxxxxx: numéro incrémental unique dédié au catalogue. Cet identifiant pourrait être généré par l'identifiant table utilisé aujoud'hui dans la base de onnées VizieR ou alors être totalement indépendant, et dans ce cas une table de correspondance devra être maintenue.

Quelles actions ?

  • Discution avec Alberto (ADS) lors de l'IVOA: son avis, l'utilisation DOI VizieR dans ADS ....
  • Faire la demande à l'INIST: le formulaire de demande est disponible ; voir avec Mark.

    pour creer un DOI, il faut etre membre de DataCite ou etre afillie par une organisation - pour nous l'INIST

    http://www.inist.fr/?Attribution-de-DOI&lang=fr
    - cotisation 180euros/an

    Creation DOI sur dataCite
    Il existe une API fournie par DataCite: voir doc inist : http://www.inist.fr/IMG/pdf/fichier_pdf_doi.pdf

  • Faire un exemple de landing page (static pour un catalogue)
  • Un point essentiel à inscrire explicitement dans les choses à faire est qu'il faut discuter avec les 'autorités' qui sont responsables des journaux (qui ne sont pas les publishers mais l'AAS, la RAS et les editeurs scientifiques de A&A qui en réfèreront au Board) pour les informer de ce que nous voulons faire et voir si ils ont des objections, et voir comment articuler les citations réciproques des DOI VizieR et journal (ce qui peut impliquer de mettre les publishers des journaux dans la boucle dans un deuxième temps, mais il faut commencer sur un accord de principe avec les autorités responsables des journaux)
-- GillesLandais - 2016-05-02
Topic revision: r9 - 2018-04-11 - GillesLandais
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2024 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback