Data Science et Machine Learning
Objectifs
⚠️ Cette formation est actuellement présentée à titre d’exemple.
Data Science et Machine Learning
Permettre aux participants de maîtriser les techniques de la data science et du machine learning pour analyser, prédire et automatiser des décisions basées sur les données.
À l’issue de la formation, les apprenants seront capables de :
Collecter et nettoyer des données depuis diverses sources.
Explorer et visualiser des datasets pour en extraire des insights.
Construire et évaluer des modèles prédictifs avec le machine learning.
Déployer des modèles pour résoudre des problèmes réels (marketing, finance, e-commerce…).
Contenu
Module 1 – Introduction à la Data Science
Définitions : Data Science, Machine Learning, Deep Learning
Cycle de vie d’un projet Data Science
Présentation des outils : Python, Jupyter Notebook, pandas, scikit-learn
Module 2 – Collecte et préparation des données
Sources de données : fichiers, APIs, bases SQL, web scraping
Nettoyage et transformation des données
Gestion des valeurs manquantes et outliers
Introduction à l’ingénierie des features
Module 3 – Analyse exploratoire et visualisation
Statistiques descriptives et corrélations
Visualisation avec matplotlib, seaborn, plotly
Détection de tendances et patterns
Communication des résultats à des non‑experts
Module 4 – Machine Learning supervisé
Régression linéaire et logistique
Arbres de décision, Random Forest, Gradient Boosting
Évaluation des modèles : RMSE, précision, F1-score, AUC
Cas pratiques : prédiction de ventes, scoring clients, etc.
Module 5 – Machine Learning non supervisé
Clustering : K-Means, DBSCAN, Hierarchical
Réduction de dimensionnalité : PCA, t-SNE
Détection d’anomalies
Applications : segmentation clients, détection de fraudes
Module 6 – Introduction au Deep Learning
Réseaux de neurones artificiels
Introduction aux frameworks : TensorFlow, PyTorch
Applications simples : classification d’images ou textes
Module 7 – Projet final
Étude de cas complète : de la collecte des données au modèle prédictif
Présentation d’un rapport et visualisations
Déploiement minimal d’un modèle (optionnel)
Prérequis
Connaissances de base :
Mathématiques et statistiques : notions de probabilités, moyenne, écart-type, corrélation.
Logique et raisonnement analytique.
Compétences techniques :
Notions de programmation Python (variables, boucles, fonctions).
Utilisation de tableurs (Excel, Google Sheets) pour manipuler des données.
Attitudes et capacités :
Curiosité pour les données et les patterns.
Volonté d’expérimenter et d’apprendre par la pratique.
Capacité à résoudre des problèmes complexes et à tirer des insights utiles pour la prise de décision.
Aucune expérience en machine learning n’est nécessaire, le programme accompagne pas à pas les débutants jusqu’au niveau opérationnel.
Programme
Module 1 – Introduction à la Data Science
Définitions : Data Science, Machine Learning, Deep Learning
Cycle de vie d’un projet Data Science
Présentation des outils : Python, Jupyter Notebook, pandas, scikit-learn
Module 2 – Collecte et préparation des données
Sources de données : fichiers, APIs, bases SQL, web scraping
Nettoyage et transformation des données
Gestion des valeurs manquantes et outliers
Introduction à l’ingénierie des features
Module 3 – Analyse exploratoire et visualisation
Statistiques descriptives et corrélations
Visualisation avec matplotlib, seaborn, plotly
Détection de tendances et patterns
Communication des résultats à des non‑experts
Module 4 – Machine Learning supervisé
Régression linéaire et logistique
Arbres de décision, Random Forest, Gradient Boosting
Évaluation des modèles : RMSE, précision, F1-score, AUC
Cas pratiques : prédiction de ventes, scoring clients, etc.
Module 5 – Machine Learning non supervisé
Clustering : K-Means, DBSCAN, Hierarchical
Réduction de dimensionnalité : PCA, t-SNE
Détection d’anomalies
Applications : segmentation clients, détection de fraudes
Module 6 – Introduction au Deep Learning
Réseaux de neurones artificiels
Introduction aux frameworks : TensorFlow, PyTorch
Applications simples : classification d’images ou textes
Module 7 – Projet final
Étude de cas complète : de la collecte des données au modèle prédictif
Présentation d’un rapport et visualisations
Déploiement minimal d’un modèle (optionnel)
Formateur / Entreprise
Contenu à venir...