Python pour la Data Science
Durée :42 heures (6 jours)
Présentiel ou à distance (visioconférence)
Prix : Sur devis – Éligible aux financements OPCO ou entreprise
Certification Qualiopi : Formation éligible Qualiopi (Actions de formation)
Modalité d’entrée/sortie : Entrée/sortie permanente (sessions mensuelles)
Objectifs pédagogiques :
À l’issue de la formation, le stagiaire sera capable de :
- Maîtriser les bases du langage Python appliqué à la Data Science.
- Manipuler, nettoyer et analyser des données à l’aide de bibliothèques spécialisées.
- Visualiser des données de manière claire et pertinente.
- Mettre en œuvre des modèles statistiques ou de Machine Learning simples.
- Utiliser Jupyter Notebook, Pandas, NumPy, Matplotlib, Scikit-learn de manière
opérationnelle.
Certification et livrables :
- Attestation de fin de formation délivrée
- Carnet de code / exercices corrigés
Programme détaillé
Module 1
Introduction à Python (1 jours – 7h)
- Présentation du langage Python.
- Installation de l’environnement (Anaconda, Jupyter).
- Variables, types, opérateurs, structures de contrôle.
- Fonctions, modules, scripts.
- Notions de programmation orientée objet.
Module 2
Python pour la manipulation de données (1 jours – 7h)
- Bibliothèque NumPy : tableaux, opérations vectorielles, fonctions mathématiques.
- Bibliothèque Pandas : séries, dataframes, lectures/écritures de fichiers (CSV, Excel).
- Nettoyage et préparation des données.
Module 3
Visualisation des données (1 jour – 7h)
- Introduction à la DataViz.
- Matplotlib, Seaborn, Plotly : graphiques statiques et interactifs.
- Mise en forme des visualisations : titres, légendes, couleurs, styles.
Module 4
Statistiques et probabilités avec Python (1 jour – 7h)
- Statistiques descriptives.
- Tests statistiques de base.
- Corrélations et distributions.
- Introduction à SciPy et StatsModels.
Module 5
Introduction au Machine Learning (1 jours – 7h)
- Principes de base de l’apprentissage automatique.
- Régression linéaire, classification (k-NN, arbres de décision).
- Evaluation de modèles (cross-validation, métriques).
- Introduction à Scikit-learn.
Module 6
Projet de fin de formation (7 jours – 7h)
- Mise en application des compétences : mini-projet guidé.
- Analyse exploratoire, modélisation, visualisation, restitution orale.
- Soutenance du projet
Public visé
- Étudiants, ingénieurs, chercheurs, data analysts, statisticiens.
- Toute personne souhaitant se reconvertir dans les métiers de la Data Science.
Prérequis
- connaissances de base en statistiques et en informatique.
- Aucune expérience préalable en Python n’est nécessaire.
Méthodes pédagogiques
- Formation active : alternance entre théorie, démonstrations, exercices pratiques.
- Mise en pratique sur jeux de données réels.
- Accès à une plateforme e-learning (documents, notebooks, quiz)
Modalités d’évaluation
- Évaluations formatives tout au long de la formation (quiz, QCM, exercices).
- Évaluation sommative finale : projet pratique noté + soutenance orale
Accessibilité
Formation adaptable aux personnes en situation de handicap. Contactez-nous pour
organiser les modalités spécifiques.
Modalités d’inscription
- Formulaire de préinscription en ligne ou contact par mail
- Entretien de positionnement en amont
- Convention ou contrat de formation transmis avant démarrage