Introduction au Machine Learning et au Deep Learning avec Python
Formation
|
|
Objectifs
- Comprendre les concepts mathématiques des méthodes de l'apprentissage statistique supervisé (régression et classification)
- Connaître les principaux algorithmes du deep learning
- Savoir utiliser les librairies Python pour la mise en oeuvre des méthodes de machine learning et de deep learning
- Savoir choisir les algorithmes adaptés aux cas d'usages
- Savoir interpréter les résultats des algorithmes et identifier leurs limite
Programme
- Introduction à l'apprentissage supervisé : régression et classification, fonctions de coût, classifieur de Bayes, métriques d'évaluation, concepts de validation croisée et de sur-apprentissage, gradient stochastique et optimisation
- Méthodes linéaires : modèles linéaires généralisés, régression logistique, méthodes de régularisation ridge, lasso, problèmes en grande dimension
- Méthodes non linéaires : arbres de décision, CART, boosting, forêts aléatoires
- Introduction aux réseaux de neurones profonds (deep neural nets ou deep NN) : dense NN, feed-forward NN, convolutional NN pour les images. Mise en ouuvre avec scikit-learn et PyTorch (sous Python)
Public
Chercheuses, chercheurs, ingénieures et ingénieurs en lien avec des problématiques de sciences des données, allant des sciences expérimentales aux sciences humaines ; data-scientists, data-miners et développeurs souhaitant aborder l'état de l'art en sciences des données
Prérequis
- Connaissances de base en probabilités et statistique
- Connaissances de base en Python
Equipement
Les séances de travail de l'après midi seront entièrement sur machine.
La formation se fonde sur un ensemble d'outils open-sources et gratuits.
Chaque stagiaire vient avec son propre ordinateur sur lequel elle ou il a préalablement installé les outils nécessaires
Les jours de la formation, penser à charger votre ordinateur en amont et apporter votre chargeur.
Outils à installer
- 1. Commencer par mettre à jour l'OS de votre ordinateur.
- 2. Installer Python 3.10. (la dernière version). Vous pouvez utiliser la distribution Anaconda Python 3.10 disponible sur www.anaconda.com
-
3. Installer les librairies suivantes :
- jupyterlab
- numpy
- pandas
- scikit-learn
- scipy
- matplotlib
- seaborn
- pytorch
- requests
OU
-
3-bis. Alternative avec Conda :
- Se créer un répertoire de travail dans lequel vous aurez copié le fichier requirements.txt
-
Ouvrir une console / terminal (sous windows cela s'appelle Conda Prompt). Se placer dans le répertoire de travail et taper
conda install pip
pip install -r requirements.txt
Cette commande va installer toutes les librairies utilisées lors de la formation.
Transparents du cours
- Binary classification Slides day 1
- Decision trees and ensemble learning Slides day 2
- Deep learning Slides day 3
Notebooks pour les séances sur machine
Les notebooks pour les séances sur machine se trouvent sur github