ATELIER : Initiation au Machine learning
Pour connaitre les prochaines sessions de formation sur l’Intelligence Artificielle, cliquez ici
Le monde de l’Internet des Objets est confronté aux traitements des données mesurées. L’objectif de cet atelier sera de se familiariser et de maîtriser les règles de base du Machine Learning, de connaître les familles d’algorithmes et de développer quelques algorithmes pour appréhender le travail sur les variables et l’optimisation des erreurs de modélisation. Cela s’adresse à un auditoire familier des manipulations de données et de calcul sur ces données, ayant besoin de mieux comprendre ce que représente le Machine Learning en terme de possibilité et de savoir-faire.
Intervenant : DOPTIM
PROGRAMME
1. Les grands principes du Machine Learning
1.1 Les modélisations supervisées, non-supervisées et par renforcement
1.2 Les étapes de construction d’un modèle
1.3 L’évaluation des modèles
Pratique : Évaluer et comparer des modèles préparés pour l’exercice
2. Préparation des variables
2.1 La nature statistique des données et leurs dimensions
2.2 Représenter les variables, Détecter les données aberrantes
2.3 Le ré-échantillonnage de variables
2.4 Réduire le set de variables pour un modèle, faire avec les multi-colinéarités
2.5 Traiter les classes rares
3. Les algorithmes
3.1 Présentation de modèles
Régression linéaire simple, multiple, polynomiale.
Régression logistique Classification hiérarchique et non hiérarchique (K-means)
Classification par arbres de décision et ensemble Naïve Bayes, Random Forest
Machines à vecteurs supports
Méthodes à noyaux
Gradient Boosting
Réseau neuronal
3.2 Mise en pratique
Chaque modèle est accompagné d’un exemple pré-codé. Les exercices s’intercalent dans la présentation pour permettre à chaque équipe de tester les modèles sur leur propre jeu de données.
Public visé : Ce cours s’adresse aux Ingénieur et technicien en bureau d’études ou tout autre personne utilisant de la modélisation de données
Prérequis : Connaissance en programmation Python, les librairies scikit-learn et pandas seront utilisés
Objectif : Comprendre l’articulation des domaines d’activité autour de la donnée afin de discerner les besoins de son entreprise, là où elle peut faire monter en compétence ces propres équipes et là où il sera plus efficace de faire appel à de l’expertise externe. - Qu’est ce la data science, le Machine Learning, le Deep Learning, le big data et l’intelligence artificielle ? - Qui sont les acteurs majeurs et locaux dans ces domaines ?
INFORMATIONS PRATIQUES
Lieu :
Rennes