Suivez

la liste

Niveau des candidats: Master pro ou élève ingénieur.

Contexte: La plateforme CALLISTO, développée par le méso-centre de calcul CALMIP, est une interface destinée au partage et à la fouille de données scientifiques. Actuellement en phase d’exploitation limitée à un nombre restreint d’utilisateurs, l’architecture de l’application s’organise autour d’un dépôt de données (DataVerse, cf. https://dataverse.org) et d’une ontologie venant enrichir les possibilités de mise en relation et d’exploitation de données et de traitements. CALLISTO est une plateforme opérationnelle, visant à offrir un service pérenne à ses utilisateurs.

L’accent sera mis sur le respect de la qualité du développement à destination d’une application en production et la robustesse des solutions proposées. Ce stage s’inscrit au sein du chantier DataNoos/DataCore, en cohérence avec d’autres stages sur des problématiques voisines.

Encadrement: Le stage sera encadré par Thierry Louge au méso-centre CALMIP (thierry.louge@toulouse-inp.fr), et Pascal Dayre à l’IRIT (pascal.dayre@irit.fr).

Problématique et sujet de stage: Les outils de gestion et de définition de flux de traitements de données (workflows) sont un élément important dans les méthodes modernes de fouille systématique de données. CALLISTO embarque son propre générateur et lanceur de flots de traitement, mais l’intégration de moteurs de workflows existants (https://taverna.incubator.apache.org/introduction/ https://wrench-project.org/ https://pegasus.isi.edu/ ...) est un enjeu important pour le succès de cette interface. Dataverse propose une API permettant de consulter, de modifier des métadonnées et d’accéder aux jeux de données déposés sur la plateforme. La sélection des fonctionnalités de cette API et leur interfaçage avec les ontologies de CALLISTO et les moteurs de workflows est à définir. En conséquence, ce stage vise à:

  1. Dresser un état de l’art des moteurs de workflows existants (non-commerciaux).
  2. Identifier les composants individuels de CALLISTO utilisables comme «Web services» en vue:

    • D’un interfaçage avec un moteur de Workflows
    • D’un interfaçage avec les délivrables des autres stages de DataNoos/DataCore.
  3. Evaluer l’intégration de ces moteur au sein de l’application, les apports et les limites.

  4. Sélectionner avec l’équipe CALMIP un de ces moteurs (sélection argumentée et documentée).
  5. Produire un code informatique robuste permettant son interfaçage avec CALLISTO.

Délivrables attendus:

  • Rapport d’évaluation des moteurs envisagés par rapport à leur adéquation avec CALLISTO.
  • Identification des fonctionnalités pouvant faire l’objet de Web Services.
  • Production de code destiné à l’utilisation d’un moteur de workflows à partir de données hébergées dans CALLISTO.

Compétences:

  • Programmation Python
  • Architecture des services Web (REST, SOAP...)
  • Sensibilisation aux notions de «qualité logiciel».
  • Un intérêt pour le Web sémantique, les raisonnements à base de logique ou la connaissance de RDF(S)/OWL serait un plus.

Lieu de travail: CALMIP: 3, Rue Caroline Aigle (ECA) 31400 Toulouse. cf. https://www.calmip.univ-toulouse.fr/contact

Gratification: Env.560€ /mois