Objectifs

⚠️ Cette formation est actuellement présentée à titre d’exemple.

Data Science et Machine Learning

Permettre aux participants de maîtriser les techniques de la data science et du machine learning pour analyser, prédire et automatiser des décisions basées sur les données.

À l’issue de la formation, les apprenants seront capables de :

Collecter et nettoyer des données depuis diverses sources.

Explorer et visualiser des datasets pour en extraire des insights.

Construire et évaluer des modèles prédictifs avec le machine learning.

Déployer des modèles pour résoudre des problèmes réels (marketing, finance, e-commerce…).

Contenu

Module 1 – Introduction à la Data Science

Définitions : Data Science, Machine Learning, Deep Learning

Cycle de vie d’un projet Data Science

Présentation des outils : Python, Jupyter Notebook, pandas, scikit-learn

Module 2 – Collecte et préparation des données

Sources de données : fichiers, APIs, bases SQL, web scraping

Nettoyage et transformation des données

Gestion des valeurs manquantes et outliers

Introduction à l’ingénierie des features

Module 3 – Analyse exploratoire et visualisation

Statistiques descriptives et corrélations

Visualisation avec matplotlib, seaborn, plotly

Détection de tendances et patterns

Communication des résultats à des non‑experts

Module 4 – Machine Learning supervisé

Régression linéaire et logistique

Arbres de décision, Random Forest, Gradient Boosting

Évaluation des modèles : RMSE, précision, F1-score, AUC

Cas pratiques : prédiction de ventes, scoring clients, etc.

Module 5 – Machine Learning non supervisé

Clustering : K-Means, DBSCAN, Hierarchical

Réduction de dimensionnalité : PCA, t-SNE

Détection d’anomalies

Applications : segmentation clients, détection de fraudes

Module 6 – Introduction au Deep Learning

Réseaux de neurones artificiels

Introduction aux frameworks : TensorFlow, PyTorch

Applications simples : classification d’images ou textes

Module 7 – Projet final

Étude de cas complète : de la collecte des données au modèle prédictif

Présentation d’un rapport et visualisations

Déploiement minimal d’un modèle (optionnel)

Prérequis

Connaissances de base :

Mathématiques et statistiques : notions de probabilités, moyenne, écart-type, corrélation.

Logique et raisonnement analytique.

Compétences techniques :

Notions de programmation Python (variables, boucles, fonctions).

Utilisation de tableurs (Excel, Google Sheets) pour manipuler des données.

Attitudes et capacités :

Curiosité pour les données et les patterns.

Volonté d’expérimenter et d’apprendre par la pratique.

Capacité à résoudre des problèmes complexes et à tirer des insights utiles pour la prise de décision.

Aucune expérience en machine learning n’est nécessaire, le programme accompagne pas à pas les débutants jusqu’au niveau opérationnel.

Kauai Formation
informatique_systemes_information

Programme

Module 1 – Introduction à la Data Science

Définitions : Data Science, Machine Learning, Deep Learning

Cycle de vie d’un projet Data Science

Présentation des outils : Python, Jupyter Notebook, pandas, scikit-learn

Module 2 – Collecte et préparation des données

Sources de données : fichiers, APIs, bases SQL, web scraping

Nettoyage et transformation des données

Gestion des valeurs manquantes et outliers

Introduction à l’ingénierie des features

Module 3 – Analyse exploratoire et visualisation

Statistiques descriptives et corrélations

Visualisation avec matplotlib, seaborn, plotly

Détection de tendances et patterns

Communication des résultats à des non‑experts

Module 4 – Machine Learning supervisé

Régression linéaire et logistique

Arbres de décision, Random Forest, Gradient Boosting

Évaluation des modèles : RMSE, précision, F1-score, AUC

Cas pratiques : prédiction de ventes, scoring clients, etc.

Module 5 – Machine Learning non supervisé

Clustering : K-Means, DBSCAN, Hierarchical

Réduction de dimensionnalité : PCA, t-SNE

Détection d’anomalies

Applications : segmentation clients, détection de fraudes

Module 6 – Introduction au Deep Learning

Réseaux de neurones artificiels

Introduction aux frameworks : TensorFlow, PyTorch

Applications simples : classification d’images ou textes

Module 7 – Projet final

Étude de cas complète : de la collecte des données au modèle prédictif

Présentation d’un rapport et visualisations

Déploiement minimal d’un modèle (optionnel)

Formateur / Entreprise

Contenu à venir...