Ce que je comprends du projet des logs
Charles Côté
Produire un programme qui prendra une des 3 sortes de log (Simbad, VizieR ou Aladin) et qui produira un log commun aux 3.
André : cela faisait partie des discussions, à priori chaque service fournirait directement ses logs dans le format pivot et s’occuperait donc de faire la conversion vers ce format pivot, mais tu peux tre bien écrire un programme de conversion à titre d’exemple
Le programme pourrait être écrit en Java et faire appel à la base de données via PostgreSQL.
À revoir : Gestion de fichiers textes en Java
Le format résultant (format pivot) pourrais être le TSV (Tab-separated values) ou CSV (Coma Separated Values) car les 2 semblent corrects pour cette utilisation
Voici les données (champs) que contiendra le format pivot :
IP | Date(en secondes) | Service | User-Agent / configuration | return code | query-string | méthode |
Les champs me semblent tous clairs, par contre j'aimerais seulement confirmer si query-string est bien l'entrée de l'utilisateur pour sa recherche (par exemple « Sirius » pour trouver de l'information sur l'objet Sirius et reformuler ce qu'est return-code (Est-ce que c'est le résultat de la recherche de l'utilisateur?).
Service : J'imagine qu'il y a seulement 3 choix pour ce champ (Simbad, VizieR ou Aladin)
Le format de Simbad est-il bien celui ci :
95.103.41.34 - - [01/Jun/2013:00:00:02 +0200] "GET /simbad/sim-script?script=format%20object%20%22%25COO(d;A%20D)%5Cn%25IDLIST(1)%22%0Aset%20epoch%20J2000%0Aset%20limit%203%0A%20query%20id%20hip HTTP/1.1" 200 585 "-" "Mozilla/5.0" 130.79.128.30 - - [01/Jun/2013:00:00:02 +0200] "GET /simbad/sim-nameresolver?Ident=AM2229-735&option=strict&Data=@,I.0,C.0,J,J.E,P,X,V,D,S,T,%23B HTTP/1.0" 200 217 "-" "wwwget/3.09" 66.249.73.200 - - [01/Jun/2013:00:00:02 +0200] "GET /simbad/sim-id?Ident=%5BZJM2003%5D%20SA%2095-1141 HTTP/1.1" 200 18184 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"Questions :
Est-ce qu'il y a seulement 3 différentes sortes de log ou bien il y en a plus ?
Pourrais-je avoir un exemple de chacun de ces logs ?
Ou sont stockés les logs présentement ? Sur Piwik ?
Quels sont les formats de ses logs ?
Les champs du format données plus haut sont-ils toujours exacts ?