DIAMS : Data Integration, Analysis, and Management as Services
Mots clés
Analyse et exploration de données, Gestion intégrée de données hétérogènes et multimodales, Composition de chaînes de traitements analytiques et services, Optimisation et personnalisation
Applications
Internet des Objets, Villes Intelligentes, Défense, Développement Durable, Transport Maritime
Responsable
Omar BOUCELMA, Noël NOVELLI
Membres
Enseignant/Chercheur
omar.boucelma@lis-lab.fr
04 91 05 60 53
Saint-Jérôme, POLYTECH GII, bureau P219
Enseignant/Chercheur
ivan.madjarov@lis-lab.fr
04 .91 17 79 17
Luminy, AMU TPR2 ET GRAND HALL, bureau 425
Enseignant/Chercheur
sana.sellami@lis-lab.fr
04 91 05 60 57
Saint-Jérôme, POLYTECH GII, bureau P112
Enseignant/Chercheur
etienne.thuillier@lis-lab.fr
04 91 05 60 12
Saint-Jérôme, POLYTECH GII, bureau P224
Objectif scientifique
Notre objectif principal est d’offrir de services pour automatiser et adapter toute la chaîne de traitement et d’analyse de grandes masses de données multi-sources et multi-modales issues du Web, des réseaux sociaux et sans fil, des objets connectés, capteurs et applications scientifiques.
Trois axes de recherche sont proposés dans l’équipe DIAMS. Chacun d’eux est alimenté par des cas d’étude concrets issues de nos collaborations actuelles pour une application directe de nos travaux.
1. Axe Données et Sémantique. Il s’agit, en particulier, de définir des modèles de représentation des données adéquats et :
- Extraire et structurer les données issues de différentes modalités ou sources structurées ou non (Web et médias sociaux, applications scientifiques, Internet des Objets, capteurs et réseaux, données issues de la technologie sans fil, données de la ville intelligente, smart-grids, Floating Car Data, billettique, etc.) ;
- Définir et utiliser les ontologies pour la désambiguïsation et l’enrichissement sémantique des données extraites ;
- Définir et contrôler en continu la qualité des données pour détecter et corriger efficacement les anomalies.
2. Axe Traitements et Analyse. Il s’agit, en particulier, de concevoir des algorithmes, des méthodes et des services pour :
- Intégrer et fusionner efficacement des données multi-sources, hétérogènes et multi-modales ;
- Analyser les données en utilisant et en adaptant des techniques statistiques et d’apprentissage automatique ;
- Évaluer la qualité des résultats d’analyse obtenus en sortie et mieux adapter les pré-traitements de données en amont de la chaîne analytique ;
- Proposer des visualisations analytiques et générer automatiquement des explications sur les choix de traitement opérés.
3. Axe Systèmes et Gestion intégrée. Il s’agit, en particulier, de concevoir des outils et des services permettant pour :
- Indexer, manipuler, analyser et recommander de façon personnalisée les données hétérogènes et multimodales ;
- Optimiser les opérations de nettoyage et la découverte des liens entre données (dépendances fonctionnelles, contraintes, connaissances) ;
- Adapter et optimiser la qualité des résultats d’un pipeline analytique.
Nos applications et cas d’études réels relèvent du domaine de la Santé et des données biomédicales (ANR QualiHealth 2019-2023), de l’Internet des Objets et villes intelligentes, du développement durable (IRD), de la Défense (Naval Group) et du transport maritime.