Ce que vous apprendrez ?

  • Décrire les différentes méthodes de navigation et de recherche offertes par Beautiful Soup et les choisir en fonction du contexte.
  • Construire des scripts Python efficaces utilisant Beautiful Soup pour extraire des données à partir de sources web multiples.
  • Manipuler et traiter les données extraites de pages web avec Beautiful Soup, incluant la gestion des erreurs.
  • Analyser la structure d'un document HTML et naviguer dans l'arbre DOM à l'aide de Beautiful Soup.
  • Identifier et extraire des données spécifiques à partir de pages web HTML en utilisant Beautiful Soup.

Prérequis

  • Connaissance de base de l'utilisation d'un ordinateur et d'un navigateur web. Familiarité avec les concepts de base de l'Internet et du World Wide Web (URLs, HTTP). Compétences de base en programmation (variables, boucles, fonctions). Langage Python recommandé. Capacité à installer et utiliser des librairies Python via pip. Compréhension de base du HTML et du XML (balises, attributs, structure). Connaissance de base du fonctionnement d'un terminal ou d'une ligne de commande (pour les exercices pratiques). Accès à un environnement de développement Python (ex: IDE comme VS Code ou PyCharm). Motivation à apprendre et à pratiquer le scraping web de manière responsable et éthique.

Contenu de la Formation

Total: 8 Chapitres Total hours: 4
  • Introduction à Beautiful Soup et à son installation
  • Navigation dans le DOM avec Beautiful Soup
  • Sélection d'éléments avec Beautiful Soup (find, find_all)
  • Extraction de données textuelles et d'attributs
  • Gestion des balises et des attributs
  • Traitement des données extraites (nettoyage, transformation)
  • Techniques avancées de parsing (gestion des erreurs, optimisation)
  • Exemples concrets et exercices pratiques

À TÉLÉCHARGER

À propos de l'instructeur

Avatar image
Ahmed Zellou

ahmed.zellou@openskillroom.com

Ahmed Zellou Received his Ph.D. degree in Applied Sciences at the Mohammedia School of Engineers, Mohammed V University, Rabat, Morocco and ENSIMAG, Grenoble, France in 2008. He is currently a part-time Professor at Mohammed VI Polytechnic University and full Professor at ENSIAS, Mohamed V University in Rabat, Morocco. His research interests include parallel computing, Data quality, recommender system, indexation, and integration system, where he is the author/co-author of more than a hundred Scopus indexed publications. SKILLS DOMAINS • Data integration systems, complex information systems, Datawarehouse, and Web Semantic. • Modeling: Merise, UML1&2, BPMN. • Procedural and Object-oriented programming: Python, JAVA, C++, PHP. • Web development: HTML, CSS, JS and PHP. • Web Technologies: HTML, XML, PHP, Web Frameworks (Symfony, Laravel, CakePHP, CodeIgniter, Yii and Zend). • Databases, MYSQL, Postgress, Mongodb, ... Publications: ResearchGate : https://www.researchgate.net/profile/Zellou_Ahmed Scopus : https://www.scopus.com/authid/detail.uri?authorId=55644907000 Google Scholar : https://scholar.google.fr/citations?hl=fr&user=CjkVg9UAAAAJ

Retour des Apprenants

Avis

Pour ajouter un avis sur le cours, vous devez d'abord vous connecter. Connectez-vous ici

Caractéristiques du cours

  • Durée 4 hour
  • Language Français
  • Niveau de compétence.
  • CertificateNon
  • Nombre maximum d'inscrits 30
  • Type de formation distanciel

Cours connexes

Related course image
Performance Optimization et Code Splitting dans React.js
Fayçal Chebihi

2 730,00 DH
4 200,00 DH

Related course image
HTML/CSS
Ahmed Zellou

2 730,00 DH
4 200,00 DH

Related course image
RDF et sparql
Ahmed Zellou

2 730,00 DH
4 200,00 DH

Related course image
Programmation des services web
Ahmed Zellou

2 730,00 DH
4 200,00 DH

Devenir enseignant, Partagez vos connaissances

Rejoignez OpenskillRoom, la plateforme de formations synchrones qui valorise votre expertise.