Recevoir la newsletter

Machine Learning et Analyse de Données

PrésentielPrésentiel
4 jour(s)
2 400 €HT
Labège Cedex (31)
Réf. F_DATA_DM
Présentation
Cette formation vous est également proposée en interentreprises à Paris et Lyon et en intra-entreprise partout en France et au-delà.
Objectifs

Découvrir les principales étapes d'une étude de Data Science et un panorama des méthodes associées (Machine Learning, Analyse de Données). Apprendre à extraire de l’information utile à partir de données volumineuses, changeantes, non structurées.

Public visé
Décideurs, statisticiens, data scientists, chargés d’études en charge de l’exploitation des données de l’entreprise (marketing, gestion de la relation client, scoring, churn, ...)
Prérequis
Pour suivre ce stage dans de bonnes conditions, il est recommandé d'avoir suivi en amont la formation Statistique descriptive (exploratoire) : savoir décrire des observations
Points forts
Mise en situation des participants devant des problèmes concrets issus de différents secteurs d'activité et appelant les méthodes d’analyses présentées. On évite de s’appesantir sur les aspects techniques pour privilégier l’analyse critique, le domaine d’application et les conditions d’utilisation des méthodes.
Pédagogie active mêlant exposés, exercices et applications pratiques.
Chaque participant pourra mettre en oeuvre les applications dans le logiciel de son choix parmi JMP, R ou Python.
Tutorat
Renseignements :
Cédric CALAS
05 82 95 54 16
cedric.calas@datavalue.fr

Programme

- Définitions de la Data Science
Le contexte de la Data Science : volume des données, nature des problèmes, mélange des disciplines
Définitions du Machine Learning et de l'Analyse de Données
L’histoire récente

- Le processus Data Science
Les étapes du “Knowledge Discovery in Databases” (KDD)
Extraction, prétraitements et nettoyage
Analyses exploratoires
Visualisations
Modélisation
Analyse des résultats
Intégration
Échantillon d’apprentissage, de test et de validation

- Méthodes d’exploration graphique
Les analyses factorielles : composantes principales, correspondances simples et multiples
Les algorithmes de classification : arbres et centres mobiles
Les graphiques de Bertin

- Les réseaux de neurones
Principes des réseaux de neurones (perceptron)
Techniques de calculs
Applications à la résolution de nombreux problèmes dont la discrimination et la régression
Forces et faiblesses de l’approche

- Les arbres de décision
Principe des arbres
Les principaux algorithmes
Validation et élagage d’un arbre
Quelques exemples d’applications

- Les méthodes parcimonieuses
Régression pas à pas
Régression LASSO
Régression RIDGE
Elastic Net

- Les méthodes de ré-échantillonnage
Bagging
Boosting
Random Forest

- Les règles d’association
Principes et types d’application
Notion de support et de confiance
Algorithmes de recherche des règles
Quelques critères pour la sélection des règles pertinentes
Exemples

- Le Text mining
Principe et méthodes du Text mining
Techniques factorielles, typologies et lexicométrie
Quelques applications : documents, messages électroniques, Internet, …

- Les principaux logiciels de Data Science

- Bilan
Partager cette formation
Organisme de formation
Contacter

Data Value

Présentation de Data Value Site internet de Data Value

41 rue de la Découverte
31670 LABEGE

05 82 95 54 16

Prochaines sessions

Labège Cedex

du 22 au 25 mai 2018

du 16 au 19 octobre 2018

Centre de formation
Labège Cedex
41 rue de la Découverte
31670 LABEGE