DANA : Data Mining at scale
Mots clés
Analyse de mégadonnées (Big Data Analytics), données spatio-temporelles, fouille de données structurées ou non structurées, analyse de concepts formels, séries temporelles
Responsables
Alain CASALI, Mohamed QUAFAFOU
Membres
Enseignant/Chercheur
nicolas.durand@lis-lab.fr
04 91 05 60 55 / 04 91 82 86 79
https://pageperso.lis-lab.fr/nicolas.durand/
Saint-Jérôme, POLYTECH GII
Enseignant/Chercheur
frederic.flouvat@lis-lab.fr
https://flouvat.github.io/
Saint-Jérôme, POLYTECH GII, bureau 111
Enseignant/Chercheur
mohamed.quafafou@lis-lab.fr
04 91 05 60 55
Saint-Jérôme, POLYTECH GII
Objectif scientifique
Les objectifs scientifiques de l’équipe DANA portent sur les aspects théoriques et pratiques de l’analyse de mégadonnées. De nos jours, cette problématique représente un enjeu majeur au niveau scientifique, économique et sociétal. Dans ce contexte, nous proposerons des méthodes et des algorithmes en se focalisant plus particulièrement sur les points suivants :
Motifs et Modèles thématiques probabilistes : D’une part, les motifs représentent des relations entre items dont la cooccurrence est observée de façon significative. D’autre part, les modèles thématiques permettent d’expliciter des distributions de probabilités (thèmes) rendant les données observées probables.
Analyse de Concepts Formels (ACF) et Approximation : les algorithmes classiques de construction et de recherche dans les treillis de concepts sont inopérants ou bien leurs performances se dégradent de façon significative lorsqu’ils sont appliqués sur des mégadonnées. Ce problème est un challenge auquel s’attaque l’équipe DANA.
Analyse de données spatio-temporelles : Cette problématique est à la fois cruciale et d’actualité à laquelle toutes les grandes conférences importantes de notre communauté (rang A*-KDD, ECML/PKDD, ICDM, IJCAI) réservent une session dédiée aux données spatiales et /ou temporelles.