Ce que vous apprendrez ?

  • Mettre en œuvre des stratégies de monitoring et de logging pour assurer la fiabilité et le suivi des processus ETL.
  • Diagnostiquer et résoudre les problèmes courants rencontrés lors de l'utilisation de PDI, en utilisant les outils de débogage intégrés.
  • Développer et exécuter des jobs PDI robustes et optimisés pour le traitement de gros volumes de données.
  • Maîtriser l'utilisation des différentes transformations et composants de PDI pour le nettoyage, la transformation et le chargement de données.
  • Concevoir et implémenter des transformations ETL complexes dans Pentaho Data Integration (PDI).

Prérequis

  • Connaissance des bases de données relationnelles et SQL Notions fondamentales d’ETL (Extract, Transform, Load) Compréhension des concepts de Data Warehousing Expérience avec un outil BI ou d’intégration de données (ex. Talend, SSIS, Informatica, etc.) Notions en scripting (JavaScript, Shell, ou autre langage utilisé pour les transformations avancées) Familiarité avec les formats de données (CSV, XML, JSON, etc.) et leur manipulation

Contenu de la Formation

Total: 20 Chapitres Total hours: 6-12
  • Présentation de PDI et de l'ETL
  • Architecture de PDI et Kettle
  • Installation et configuration de PDI
  • Interface utilisateur et concepts de base
  • Connecteurs de données (bases de données, fichiers plats, etc.)
  • Transformations de données (filtrage, aggregation, jointure)
  • Gestion des types de données et des erreurs
  • Création de transformations simples
  • Chargement des données dans différentes destinations
  • Techniques de chargement optimisées
  • Gestion des transactions et de la cohérence des données
  • Création de jobs et d'étapes de chargement
  • Gestion des métadonnées et des transformations réutilisables
  • Paramétrage et automatisation des processus ETL
  • Gestion des erreurs et du logging
  • Conception de processus ETL robustes et performants
  • Déploiement de PDI sur différents environnements
  • Monitoring et surveillance des processus ETL
  • Optimisation des performances et de la scalabilité
  • Meilleures pratiques pour la maintenance et l'évolution des processus ETL

À TÉLÉCHARGER

À propos de l'instructeur

Avatar image
IDRISSI

nouhaila.idrissi@openskillroom.com

Nouhaila IDRISSI est Maître de conférences en Informatique et en Intelligence Artificielle. Après avoir terminé ses études à l’ENSIAS, elle a obtenu un doctorat en informatique et en apprentissage profond de l’École Mohammadia d'ingénieurs (EMI). Notre formatrice dispose de compétences pluridisciplinaires et complémentaires en IA, Big Data, Machine Learning, Deep Learning, NLP, Data Warehousing, BI et Cloud computing. Parallèlement à ses activités académiques, Dr IDRISSI est une collaboratrice active dans le milieu industriel, contribuant à combler le fossé entre la recherche académique et les applications du monde réel.

Retour des Apprenants

Avis

Pour ajouter un avis sur le cours, vous devez d'abord vous connecter. Connectez-vous ici

Caractéristiques du cours

  • Durée 6-12 hour
  • Language Français
  • Niveau de compétence.
  • CertificateNon
  • Nombre maximum d'inscrits
  • Type de formation

Devenir enseignant, Partagez vos connaissances

Rejoignez OpenskillRoom, la plateforme de formations synchrones qui valorise votre expertise.