Objectifs
Connaître les concepts fondamentaux liés à la production et l’exploitation des mégadonnées. Maîtriser les techniques d’analyse statistique, d’exploration et de visualisation de mégadonnées pour la prise de décision.
Contenu
Description des défis du traitement de données massives (big data) :
Échantillonnage et prétraitement des données : structurées, non structurées et flux. Techniques statistiques d’analyse des mégadonnées : modélisation et inférence statistique, estimation de paramètres et de distributions, maximum de vraisemblance et méthodes Bayésiennes, analyse de corrélation, analyse factorielle. Techniques de stockage, de réduction et de visualisation de mégadonnées. Apprentissage par ordinateur sur les mégadonnées : classification et regroupement, régression linéaire et non-linéaire, apprentissage profond. Étude d’applications utilisant les données massives : recherche d'information, systèmes de recommandation, analyse de réseaux sociaux.