Ce que vous apprendrez ?


Prérequis

  • Bases en systèmes d'exploitation (Linux/Unix recommandé) Connaissance des concepts fondamentaux du Big Data et du traitement distribué Notions de réseaux et de gestion des serveurs Expérience avec le shell scripting et les commandes Linux Compréhension des bases de données relationnelles et NoSQL Familiarité avec Java, Scala ou Python (recommandé pour Spark et Hadoop Streaming) Notions de gestion des clusters et de virtualisation (Docker, VMware, etc.)

Contenu de la Formation

Total: 12 Chapitres Total hours: 8
  • Définir le Big Data et ses caractéristiques : volume, vélocité, variété, véracité.
  • Présenter les composants principaux de l’écosystème Hadoop : HDFS, YARN, MapReduce.
  • Identifier les cas d’usage du Big Data : analyse de données massives, stockage distribué, traitement parallèle.
  • Installer Hadoop sur plusieurs machines pour mettre en place un cluster multi-nœuds.
  • Configurer les éléments essentiels : HDFS pour le stockage, YARN pour la gestion des ressources.
  • Effectuer des tests de fonctionnement : chargement de données, exécution de jobs MapReduce.
  • Manipuler les données avec les commandes HDFS : ajout, suppression, consultation.
  • Lancer et surveiller des jobs MapReduce pour le traitement distribué des données.
  • Intégrer Hadoop avec d'autres outils (ex. : Hive, Pig, Spark) pour des traitements avancés.
  • Utiliser les outils de monitoring intégrés : interfaces web de Hadoop, métriques, logs.
  • Mettre en œuvre des stratégies de sécurité : gestion des utilisateurs, permissions, chiffrement.
  • Optimiser les performances du cluster : équilibrage de charge, gestion des ressources, détection des pannes.

À TÉLÉCHARGER

À propos de l'instructeur

Avatar image
ENNANIA

adil.ennania@openskillroom.com

Adil ENAANAI, expert en IT et docteur en informatique, accompagne entreprises et institutions dans leur transformation digitale. Spécialiste en Spring Boot, Angular, NoSQL, Big Data et IA, il développe des solutions innovantes et optimise la gestion des données. Consultant et formateur expérimenté, il a formé de grandes entreprises comme la CDG, le CRI, Société Générale, CNSS Maroc et Orange. Enseignant passionné, il partage son expertise en JEE, Python, NoSQL et Power BI. Il crée des applications avancées, de l'IA à l’automatisation Big Data. Avec une expérience de plus de 16 ans avec des entreprises Marocaines, Françaises et Africaines, il a accumulé un haut niveau d’expertise pour résoudre des problèmes et proposer des solutions.

Retour des Apprenants

Avis

Pour ajouter un avis sur le cours, vous devez d'abord vous connecter. Connectez-vous ici

Caractéristiques du cours

  • Durée 8 hour
  • Language Français
  • Niveau de compétence.
  • CertificateNon
  • Nombre maximum d'inscrits
  • Type de formation

Devenir enseignant, Partagez vos connaissances

Rejoignez OpenskillRoom, la plateforme de formations synchrones qui valorise votre expertise.