Ce que vous apprendrez ?

  • Développer une application fonctionnelle qui utilise spaCy pour automatiser le traitement d'un ensemble de données documentaires fourni.
  • Construire des pipelines spaCy personnalisés pour automatiser des tâches spécifiques d'extraction d'informations.
  • Analyser la structure syntaxique de phrases à l'aide du parsing syntaxique de spaCy et identifier les relations entre les mots.
  • Appliquer différentes techniques de tokenisation avec spaCy pour prétraiter des textes en vue de l'analyse.
  • Identifier et extraire des entités nommées (NER) dans des documents textuels à l'aide de spaCy avec une précision de 90%.

Prérequis

  • Bases en Python et manipulation de données textuelles Introduction au traitement du langage naturel (NLP) Familiarité avec les bibliothèques NLP comme NLTK ou spaCy Concepts de Tokenisation, Lemmatisation et Stemming Compréhension des Entités Nommées (NER) et du Parsing Syntaxique Notions en Machine Learning appliqué au NLP Connaissance des structures de données textuelles (JSON, CSV, XML)

Contenu de la Formation

Total: 20 Chapitres Total hours: 6-12
  • Présentation de spaCy et de ses fonctionnalités
  • Installation et configuration de spaCy
  • Chargement de modèles linguistiques et pipelines
  • Exploration des données textuelles avec spaCy
  • Tokenisation avancée : segmentation du texte en unités significatives
  • Gestion des espaces, ponctuations et caractères spéciaux
  • Nettoyage de texte : suppression de bruit et normalisation
  • Techniques de stemming et lemmatization
  • Principes de la NER et applications
  • Entraînement de modèles NER personnalisés
  • Evaluation des performances des modèles NER
  • Utilisation de NER pour l'extraction d'informations
  • Arbres de dépendances et relations syntaxiques
  • Visualisation et interprétation des arbres de dépendances
  • Extraction d'informations basées sur la structure syntaxique
  • Applications avancées de l'analyse syntaxique
  • Développement d'applications d'automatisation basées sur spaCy
  • Intégration de spaCy avec d'autres outils et librairies
  • Exemples concrets et études de cas
  • Conseils et meilleures pratiques pour l'utilisation de spaCy

À TÉLÉCHARGER

À propos de l'instructeur

Avatar image
IDRISSI

nouhaila.idrissi@openskillroom.com

Nouhaila IDRISSI est Maître de conférences en Informatique et en Intelligence Artificielle. Après avoir terminé ses études à l’ENSIAS, elle a obtenu un doctorat en informatique et en apprentissage profond de l’École Mohammadia d'ingénieurs (EMI). Notre formatrice dispose de compétences pluridisciplinaires et complémentaires en IA, Big Data, Machine Learning, Deep Learning, NLP, Data Warehousing, BI et Cloud computing. Parallèlement à ses activités académiques, Dr IDRISSI est une collaboratrice active dans le milieu industriel, contribuant à combler le fossé entre la recherche académique et les applications du monde réel.

Retour des Apprenants

Avis

Pour ajouter un avis sur le cours, vous devez d'abord vous connecter. Connectez-vous ici

Caractéristiques du cours

  • Durée 6-12 hour
  • Language Français
  • Niveau de compétence.
  • CertificateNon
  • Nombre maximum d'inscrits
  • Type de formation

Devenir enseignant, Partagez vos connaissances

Rejoignez OpenskillRoom, la plateforme de formations synchrones qui valorise votre expertise.