Tags:
create new tag
, view all tags

Réunion Grands Catalogues du 07/09/2021

Présents : Thomas B., Coralie F., Gilles L., Giacomo M., Pierre O., Emmanuelle P., François-Xavier Pineau, Patricia V & en BBB : Marianne B.

FTP anonymous

Problèmes de sécurité importants.

=> Les dépôts se feront désormais sur une machine dédiée (en accord avec politique unistra) avec envoi d'un login-mot de passe valable 3 jours + logs des dépôts (intéressant pour la police du net).

On récupère ensuite les données sur cdsarc et on a obligatoirement un mail qui nous informe du dépôt ; ce qui est pratique et n'était pas forcément le cas jusqu'à maintenant.

Pour l'instant (en local uniquement), test sur : https://ftp.cds.unistra.fr/token/

Gilles mettra en ligne pour que les éditeurs aient le temps de modifier leurs doc.

Le FTP est surtout utilisé pour les gros fichiers qui ne passent pas sur les sites de soumissions des données.

=> Est-ce qu'à terme une solution où on peut uniquement déposer des données mais pas les récupérer ne serait pas plus sûre ?

Très grands catalogues

SDSS DR16

  • Les différences de magnitudes entre filtres ugriz et u'g'r'i'z' n'existent plus.
    => Conserver 1 seule mag.

  • Pertinence du flag ajouté par VizieR qui indique si un JName est unique ?
    => A priori pas forcément utile... Voir avec l'équipe SIMBAD s'il est utilisé (Cécile et Anaïs pour gsc4sim)
N.B. : L'affichage du JName est intéressant par contre, a priori, une interrogation directement sur ce nom n'est pas nécessaire puisqu'on peut l'utiliser pour interroger par coo.

  • Colonne MJD du SDSS qui a été transformée en date dans les précédentes versions mais ambiguïté d'époques...
    => Laisser le MJD d'origine !
Demande de Brian McLean pour ajouter la dernière version du GSC = 2.4

=> A voir avec lui. A priori, c'est le même Brian qui pourrait avoir les données Pan-STARRS DR2 que l'on n'a toujours pas récupérées.

N.B. Actuellement on a la DR1 qui a potentiellement des problèmes sur les époques.

2021ApJS..254...24S : Dark Energy Survey (DES) Year 3 "Gold" ; ~399 millions d'objets

La qualité des données a l'air meilleure...
=> A voir en fonction des priorités (SDSS DR16, PS2, GSC, cat. ESO... !)

N.B. : la page https://des.ncsa.illinois.edu/releases ne donne pas de Y3 Gold mais plusieurs catalogues Y3 en fonction de types d'objets...

Gaia DR3


Prévu pour printemps 2022.

Contiendra :

  • des spectres mais on ne prévoit d'avoir que les liens vers ceux-ci.
  • 54 tables de x-match ! Voir ce qui est intéressant pour nous...
  • Séries temporelles pour Andromède (GAPS) avec plusieurs époques.
    => Demander comment ils prévoient d'organiser les données : on ne gère pas les vecteurs.
Surveys annexes : GES (Gaia ESO Survey) => plein de petits catalogues

Projection de l'espace nécessaire

Futurs catalogues : Euclide (relativement petit : 30 millions de spectres; catalogue de galaxies avec morphologie) mais surtout LSST = ~40 milliards d'objets !

Ordre de grandeur LSST multiplié par 2-3 devrait donner une bonne idée de la prévision. Prévoir plutôt plus large que pas assez.

Données brutes de Gaia font ~6To même si une fois traitées la taille est moindre + besoin d'~10To pour travailler.

Question sur le stockage des données d'origine => tant qu'on peut le faire, c'est utile.

-- EmmanuellePerret - 2021-09-07

Topic revision: r2 - 2021-09-07 - EmmanuellePerret
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2024 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback