Ce que vous apprendrez ?

  • Concevoir et mettre en œuvre un système complet de résumé automatique de documents en utilisant les techniques apprises, incluant le prétraitement, la modélisation et l'évaluation.
  • Ajuster finement (fine-tune) un modèle pré-entraîné (BERT ou GPT) pour la tâche de résumé automatique sur un corpus de données spécifique.
  • Évaluer la performance de différents modèles de résumé automatique à l'aide de métriques pertinentes telles que ROUGE.
  • Implémenter un pipeline de traitement de langage naturel (NLP) pour préparer des données textuelles pour l'entraînement de modèles de résumé.
  • Comparer et contraster les architectures de modèles de langage tels que BERT et GPT pour la tâche de résumé automatique.

Prérequis

  • Bases en traitement du langage naturel (NLP) Maîtrise de Python et des bibliothèques NLP (NLTK, SpaCy, Hugging Face Transformers, etc.) Connaissance des modèles de Deep Learning appliqués au NLP (RNN, LSTM, Transformers) Expérience avec les frameworks de Machine Learning et Deep Learning (TensorFlow, PyTorch) Compréhension des modèles de Transformers (BERT, GPT, T5, etc.) Manipulation de jeux de données textuels et techniques de prétraitement des textes Expérience avec les API d'inférence et de fine-tuning de modèles pré-entraînés Notions en évaluation des modèles de résumé automatique (ROUGE, BLEU, METEOR, etc.)

Contenu de la Formation

Total: 20 Chapitres Total hours: 6-12
  • Introduction au Traitement du Langage Naturel (NLP)
  • Architectures des Transformers
  • Présentation de BERT : Architecture et Fonctionnement
  • Applications de BERT en NLP
  • Adaptation de BERT pour la tâche de résumé
  • Techniques de pré-entraînement et finetuning pour BERT
  • Evaluation des modèles de résumé : métriques et benchmarks
  • Exemples pratiques d'utilisation de BERT pour le résumé
  • Introduction à GPT et ses variantes
  • Utilisation de GPT pour générer des résumés extractifs et abstractifs
  • Comparaison de BERT et GPT pour le résumé automatique
  • Autres modèles de langage pour le résumé : T5, BART, etc.
  • Optimisation des modèles pour la vitesse et l'efficacité
  • Gestion des données et prétraitement du texte
  • Techniques d'augmentation de données pour améliorer la performance
  • Débogage et résolution de problèmes courants
  • Développement d'un système de résumé automatique complet
  • Intégration avec des API et des outils existants
  • Déploiement du système sur une plateforme cloud
  • Présentation des projets et discussion

À TÉLÉCHARGER

À propos de l'instructeur

Avatar image
IDRISSI

nouhaila.idrissi@openskillroom.com

Nouhaila IDRISSI est Maître de conférences en Informatique et en Intelligence Artificielle. Après avoir terminé ses études à l’ENSIAS, elle a obtenu un doctorat en informatique et en apprentissage profond de l’École Mohammadia d'ingénieurs (EMI). Notre formatrice dispose de compétences pluridisciplinaires et complémentaires en IA, Big Data, Machine Learning, Deep Learning, NLP, Data Warehousing, BI et Cloud computing. Parallèlement à ses activités académiques, Dr IDRISSI est une collaboratrice active dans le milieu industriel, contribuant à combler le fossé entre la recherche académique et les applications du monde réel.

Retour des Apprenants

Avis

Pour ajouter un avis sur le cours, vous devez d'abord vous connecter. Connectez-vous ici

Caractéristiques du cours

  • Durée 6-12 hour
  • Language Français
  • Niveau de compétence.
  • CertificateNon
  • Nombre maximum d'inscrits
  • Type de formation

Devenir enseignant, Partagez vos connaissances

Rejoignez OpenskillRoom, la plateforme de formations synchrones qui valorise votre expertise.