Introduction au Big Data
Data Value
Non finançable CPF
Tout public
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
Nous contacter
Durée
Nous contacter
Localité
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
Objectifs
- Comprendre le concept du Big Data
- Être capable d'identifier l'écosystème et comprendre les technologies associées
- Savoir anticiper son intégration dans les activités informatiques de l'entreprise
Programme
- Définition commune du Big Data selon les grands acteurs du marché
- Description des technologies de référence du Big Data
- Relation entre Big Data et Cloud DaaS (Data as a Service)
- Déploiement et utilisation du Big Data
- L'apport du NoSQL
- Une journée au cœur des écosystèmes Hadoop et Spark
- Caractéristiques techniques des 3V de Gartner (Vélocité, Variété et Volume) et les variantes (Véracité, Valeur, Validité....)
- Big Data : pourquoi maintenant ?
- Traitement des données structurées, semi-structurées et déstructurées
- Transformation des données massives en informations utiles et en valeur
- Gestion des données en cycles, de l'acquisition à la gouvernance. Use Case et stratégies (GAFA (Google, Apple, Facebook, Amazon), exemples santé, grande distribution, bancassurance…)
- Les grands acteurs et le marché du Big Data
- Description des technologies de référence du Big Data
- NoSQL (Not Only SQL) et les nouvelles compétences attendues (Python, R, Scala, Java)…
- Hadoop : un modèle d'open source du Big Data adopté par les grands acteurs de l'informatique (IBM, Oracle, Amazone, EMC, Google...)
- Principaux composants d'Hadoop : HDFS (Hadoop Distributed File System), MapReduce, Pig, Flume, Zookeeper, H-BASE, Lucene, Hive, Cloudera, Oozie, Cassandra, Machine Learning...
- Autres solutions : Docker, OpenStack, Elastic, Splunk…
- Nouvelles architectures techniques pour traiter des données massives et non-structurées, en temps réel (SPARK)
- Relation entre Big Data et Cloud DaaS (Data as a Service)
- Technologies associées au Cloud (datacenters, stockage, virtualisation, Grid, OS d'orchestration d'Openstack, réseaux...)
- Émergence des solutions Big Data proposées en mode Cloud DaaS (Data as a service)
- Déploiement et utilisation du Big Data
- Description d'une plate-forme de Big Data et bonnes pratiques
- Intégration des données et systèmes existants à la plate-forme Big Data
- Acquisition et qualification des données ouvertes des organisations publiques et sociales (Open Data)
- Traitement des données à la volée (Data Streaming)
- Analyse de données (Data Analytics et Business Intelligence)
- Présentation des informations (Data Visualization)
- L'apport du NoSQL
- Description des principales familles de bases de données NoSQL
- Zoom sur MongoDb
- Zoom sur Cassandra
- Zoom sur Neo4j
- Une journée au cœur des écosystèmes Hadoop et Spark
- Introduction générale
- Les principales briques et leur rôle
- PIG, Hive, Oozie, Flume, HDFS, MapReduce, Sqoop, Zookeeper, Hbase, Mahout, les connecteurs, …
- SparkML, SparkQL, MLlib, Kafka, Storm, Flink , Beam, …
- Démonstrations et discussions.
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation
Ces formations peuvent vous intéresser
Power BI : Approfondissement - Analyse et Modélisation avec le langage DAX
MONTPELLIER, RENNES, TOULOUSE ET 8 AUTRE(S) LOCALITÉ(S)

Non finançable CPF
À distance / En centre
Salarié en poste / Demandeur d'emploi / Entreprise
Dawan
DATA ANALYST | Titre RNCP niveau 7 Bac +5 | co-certifiée école MINES Paris
À DISTANCE

Finançable CPF
À distance / En entreprise
Salarié en poste / Demandeur d'emploi / Entreprise
Technicien Support Informatique
PARIS 10E, LYON 9E

Non finançable CPF
En alternance
Étudiant
IPI
CCNA - Administrateur Réseau
À DISTANCE

Non finançable CPF
À distance
Tout public
BIGMIND ACADEMY
Formation Microsoft Fabric
À DISTANCE

Non finançable CPF
À distance
Entreprise
ACCESS IT
Architecte Cybersécurité et SI - Bac+5
SAINT-HERBLAIN, PÉROLS

Finançable CPF
À distance / En alternance / En centre
Demandeur d'emploi / Étudiant
Diginamic
Les formations les plus recherchées
Lyon
Toulouse
Marseille
Montpellier
Paris
Bordeaux
Dijon
Mâcon
Nantes
Rennes
Informatique CPF
Informatique en Ligne
Spark
Spark CPF
Spark en Ligne
Hadoop
Data scientist
Big data
Business intelligence
Technicien support informatique
Consultant en informatique
Administrateur systeme
Technicien informatique
Programmation
Technicien reseaux
Big data Paris
Business intelligence Paris
Data scientist Paris
Hadoop Goussainville
Spark Alfortville
Spark Antony
Hadoop Villiers-le-Bel
Data scientist Paris 10e
Business intelligence Paris 10e
Big data Paris 10e