Objectifs
Au terme de ce cours, l’étudiant.e comprendra les principales méthodes statistiques utilisées en analyse des données. Il/elle sera en mesure d’appliquer ces méthodes pour résoudre des problèmes pratiques à l’aide d’un langage de programmation (ex. Python ou R).
Contenu
Types de données et prétraitement : échantillonnage, nettoyage. Statistique descriptive pour la visualisation et l’interprétation des données. Statistique inférentielle: sélection d’un modèle statistique, estimation de paramètres d’un modèle à partir de données, prédiction. Maximum de vraisemblance. Modèles linéaires pour la régression et la classification. Évaluation d’un modèle statistique (ex. biais, consistance, etc.). Analyse de variance. Processus stochastiques. Introduction à la statistique Bayésienne. Ce cours comporte des séances obligatoires de travaux dirigés (TD).