Ce que vous apprendrez ?

  • Construire et évaluer un pipeline complet de NLP pour résoudre un problème réel à l'aide des librairies mentionnées.
  • Extraire des insights significatifs à partir de données textuelles en utilisant des techniques NLP avancées.
  • Comparer et contraster les performances de différents modèles NLP, incluant BERT et GPT, sur des tâches spécifiques.
  • Implémenter des modèles de traitement du langage naturel (NLP) utilisant Gensim pour l'analyse de sujets et la modélisation des mots.
  • Identifier et appliquer les techniques de prétraitement de texte appropriées à l'aide de NLTK et SpaCy.

Prérequis

  • Bases en Traitement du Langage Naturel (NLP) Maîtrise de Python et des bibliothèques NLP (NLTK, SpaCy, Gensim, etc.) Connaissance des modèles de Deep Learning appliqués au NLP (RNN, LSTM, Transformers) Expérience avec les frameworks de Machine Learning et Deep Learning (TensorFlow, PyTorch) Manipulation et prétraitement des textes (tokenization, stemming, lemmatization, etc.) Compréhension des modèles de Transformers (BERT, GPT) et de leur fonctionnement Expérience avec la vectorisation des textes (TF-IDF, Word2Vec, GloVe, embeddings pré-entraînés) Techniques d’analyse de texte avancées : classification, résumé automatique, génération de texte

Contenu de la Formation

Total: 20 Chapitres Total hours: 6-12
  • Définition et applications du NLP
  • Préparation et nettoyage des données textuelles
  • Techniques de base de traitement du texte (tokenisation, stemming, lemmatisation)
  • Introduction à NLTK
  • Analyse de sentiment avec NLTK
  • Extraction d'entités nommées (NER) avec NLTK
  • Analyse de la fréquence des mots et création de nuages de mots
  • Techniques avancées de traitement du texte avec NLTK
  • Introduction à Spacy et ses fonctionnalités
  • Pipeline de traitement de Spacy
  • NER et analyse de dépendances avec Spacy
  • Comparaison entre NLTK et Spacy
  • Introduction aux Word Embeddings (Word2Vec, GloVe)
  • Utilisation de Gensim pour créer et utiliser des Word Embeddings
  • Applications des Word Embeddings dans des tâches de NLP
  • Analyse de similarité sémantique
  • Architecture de BERT et GPT
  • Utilisation de BERT et GPT pour des tâches de NLP (classification, génération de texte)
  • Fine-tuning de modèles pré-entraînés
  • Limites et considérations éthiques des grands modèles de langage

À TÉLÉCHARGER

À propos de l'instructeur

Avatar image
IDRISSI

nouhaila.idrissi@openskillroom.com

Nouhaila IDRISSI est Maître de conférences en Informatique et en Intelligence Artificielle. Après avoir terminé ses études à l’ENSIAS, elle a obtenu un doctorat en informatique et en apprentissage profond de l’École Mohammadia d'ingénieurs (EMI). Notre formatrice dispose de compétences pluridisciplinaires et complémentaires en IA, Big Data, Machine Learning, Deep Learning, NLP, Data Warehousing, BI et Cloud computing. Parallèlement à ses activités académiques, Dr IDRISSI est une collaboratrice active dans le milieu industriel, contribuant à combler le fossé entre la recherche académique et les applications du monde réel.

Retour des Apprenants

Avis

Pour ajouter un avis sur le cours, vous devez d'abord vous connecter. Connectez-vous ici

Caractéristiques du cours

  • Durée 6-12 hour
  • Language Français
  • Niveau de compétence.
  • CertificateNon
  • Nombre maximum d'inscrits
  • Type de formation

Devenir enseignant, Partagez vos connaissances

Rejoignez OpenskillRoom, la plateforme de formations synchrones qui valorise votre expertise.