Partie I

Introduction generale
Introduction à Hadoop & ecosystem
Architecture de Hadoop & HDFS
ZooKeeper, Sqoop, Flume
Introduction à MapReduce
Pig,Hive, Hbase
introduction Impala & hive
Modelisation & gestion des donnees avec Impala & Hive
Programmation Java pour hadoop
Les Bases de Spark
Developpement & deploiement d'applications spark
Parallelisme avec spark
Hadoop vs Spark
Exploration de données et Machine learning sous Spark

Partie II

Introduction à la programmation R
Styructure de Données R
Fonctions
Introduction aux Statitiques
Machine Learning avec R
Visualistations de données
Gestion & Analyse de donnees hadoop avec R (RHadoop)

Partie III

Introduction à Python
Structure de donnees
Operateurs basiques & fonctions
Manipulation des données avec Pandas
Machine Learning avec Scikit Learn
Visualisation de donnees avec Python
Integration Python avec Hadoop MapReduce et Spark

Labs

Mise en Place des environnements R (RStudio) /Python (Anaconda)
Visaulisations des donnees R/Python
ML avec R/Python
Deploiement de Hadoop
Gestion de donnees distribuees avec Spark
Gestion & Analyse de donnees hadoop avec R (RHadoop)
Integration Python avec Hadoop MapReduce et Spark
Mise en oeuvre avec un cas concret ( compagnie telecom , boutique en ligne, ..)

Ce cours s'adresse aux informaticiens et forme des collaborateurs sur les méthodes d’analyse de données massives publiées.


Détails sur la formation

IMPORTANT: Pour les labs, on met a votre disposition l'accès à un data

Cibles: Toute personne curieuse ayant des bases en programmation et bases de données
Developpeurs Web
Ingenieurs Business Intelligence
Administrateurs systemes
Managers IT
Ingenieurs IT
Ingenieurs Cloud
Administrateurs de Bases de donnéés
Analystes de données

Certifications: A la fin de la formation les candidats pourront choisir de preparer facilement les certifications suivantes :
Oracle Big Data Certified Implementation Specialist (Oracle)
CCA Spark and Hadoop Developer (Cloudera)
MapR Certified Hadoop Developer (MapR)
MapR Certified Spark Developer (MapR)
HDP Certified Developer(Hortonworks)
HDP Certified Spark Developer (Hortonworks)
hdp certified hadoop administrator

Pas de pré-requis

Détails

  • Catégorie BI & Big Data
  • Durée 50 heures