Ce que vous apprendrez ?

  • Comparer et contraster différentes approches de gestion des données en temps réel, incluant les aspects de scalabilité et de tolérance aux pannes.
  • Déboguer et optimiser des applications Spark et Kafka pour le traitement de Big Data en temps réel.
  • Évaluer les performances de différents algorithmes de traitement de données en temps réel sur de grands ensembles de données.
  • Implémenter des pipelines de traitement de données en temps réel en utilisant Spark Streaming et Kafka.
  • Décrire l'architecture et les composants clés de Spark et Kafka pour le traitement de données en temps réel.

Prérequis

  • Notions fondamentales en Big Data et architectures distribuées Bases en programmation Scala ou Python pour Spark Compréhension du modèle de programmation de Spark (RDD, DataFrame, Dataset) Familiarité avec les systèmes de messagerie et streaming (Kafka, RabbitMQ, etc.) Connaissance des bases de données distribuées et stockage (HDFS, Parquet, Cassandra, etc.) Notions en gestion des flux de données en temps réel (Spark Streaming, Kafka Streams, Flink, etc.) Expérience en déploiement et gestion des clusters Big Data (YARN, Kubernetes, Docker, etc.

Contenu de la Formation

Total: 20 Chapitres Total hours: 6-12
  • Définition et enjeux du Big Data
  • Introduction à Apache Spark : Architecture et Fonctionnement
  • RDDs et Transformations
  • Actions et Optimisations de base
  • Introduction à Spark Streaming
  • DStreams et opérations de base
  • Fenêtrage et agrégation
  • Intégration avec des sources de données externes
  • Architecture et concepts de base de Kafka
  • Produire et consommer des messages avec Kafka
  • Intégration de Kafka avec Spark Streaming
  • Gestion des erreurs et des fautes
  • Conception d'une application de traitement de données en temps réel
  • Mise en œuvre d'une pipeline de traitement de données
  • Tests et débogage d'applications Spark Streaming
  • Optimisation des performances
  • Etude de cas concrets de traitement de données en temps réel
  • Meilleures pratiques pour le développement d'applications Spark et Kafka
  • Sécurité et scalabilité des applications
  • Défis et perspectives futures du Big Data en temps réel

À TÉLÉCHARGER

À propos de l'instructeur

Avatar image
IDRISSI

nouhaila.idrissi@openskillroom.com

Nouhaila IDRISSI est Maître de conférences en Informatique et en Intelligence Artificielle. Après avoir terminé ses études à l’ENSIAS, elle a obtenu un doctorat en informatique et en apprentissage profond de l’École Mohammadia d'ingénieurs (EMI). Notre formatrice dispose de compétences pluridisciplinaires et complémentaires en IA, Big Data, Machine Learning, Deep Learning, NLP, Data Warehousing, BI et Cloud computing. Parallèlement à ses activités académiques, Dr IDRISSI est une collaboratrice active dans le milieu industriel, contribuant à combler le fossé entre la recherche académique et les applications du monde réel.

Retour des Apprenants

Avis

Pour ajouter un avis sur le cours, vous devez d'abord vous connecter. Connectez-vous ici

Caractéristiques du cours

  • Durée 6-12 hour
  • Language Français
  • Niveau de compétence.
  • CertificateNon
  • Nombre maximum d'inscrits
  • Type de formation

Devenir enseignant, Partagez vos connaissances

Rejoignez OpenskillRoom, la plateforme de formations synchrones qui valorise votre expertise.