Ce que vous apprendrez ?

  • Interpréter et visualiser les résultats des algorithmes de clustering et de classification afin d'extraire des informations pertinentes et de tirer des conclusions significatives.
  • Décrire et appliquer des techniques de prétraitement des données (nettoyage, transformation, réduction de dimensionnalité) pour améliorer la performance des algorithmes de clustering et de classification.
  • Sélectionner et justifier le choix d'un algorithme de clustering ou de classification adapté à un problème spécifique, en tenant compte des caractéristiques des données et des objectifs de l'analyse.
  • Implémenter et évaluer au moins trois algorithmes de classification (SVM, arbres de décision, réseaux de neurones) en utilisant des métriques appropriées (précision, rappel, F1-score).
  • Comparer et contraster au moins cinq algorithmes de clustering différents (K-means, hiérarchique, DBSCAN, etc.) en fonction de leurs performances sur des jeux de données variés.

Prérequis

  • Notions fondamentales en statistiques et probabilités Bases en programmation Python et manipulation de données (Pandas, NumPy, Scikit-learn) Compréhension des concepts de Data Mining et d’apprentissage automatique (Machine Learning) Familiarité avec les algorithmes de clustering (K-Means, DBSCAN, Agglomératif) et de classification (SVM, Random Forest, Réseaux de Neurones, etc.) Expérience en visualisation et interprétation des résultats (Matplotlib, Seaborn, Power BI, Tableau, etc.)

Contenu de la Formation

Total: 20 Chapitres Total hours: 6-12
  • Définition et objectifs du clustering
  • Distances et similarités
  • Algorithmes de clustering partitionnels (K-means)
  • Evaluation des performances de clustering
  • Clustering hiérarchique agglomératif et divisif
  • Dendrogrammes et choix du nombre de clusters
  • Algorithmes de clustering basés sur la densité (DBSCAN)
  • Comparaison des différentes approches de clustering
  • Définition et objectifs de la classification
  • Métriques d'évaluation de la classification
  • Classification supervisée vs non supervisée
  • Introduction aux arbres de décision
  • Construction et interprétation des arbres de décision
  • Techniques de régularisation (élagage)
  • Introduction aux forêts aléatoires (Random Forest)
  • Avantages et inconvénients des forêts aléatoires
  • Introduction aux SVM
  • Noyaux et hyperparamètres des SVM
  • Evaluation des modèles de classification (précision, rappel, F1-score)
  • Courbe ROC et AUC

À TÉLÉCHARGER

À propos de l'instructeur

Avatar image
IDRISSI

nouhaila.idrissi@openskillroom.com

Nouhaila IDRISSI est Maître de conférences en Informatique et en Intelligence Artificielle. Après avoir terminé ses études à l’ENSIAS, elle a obtenu un doctorat en informatique et en apprentissage profond de l’École Mohammadia d'ingénieurs (EMI). Notre formatrice dispose de compétences pluridisciplinaires et complémentaires en IA, Big Data, Machine Learning, Deep Learning, NLP, Data Warehousing, BI et Cloud computing. Parallèlement à ses activités académiques, Dr IDRISSI est une collaboratrice active dans le milieu industriel, contribuant à combler le fossé entre la recherche académique et les applications du monde réel.

Retour des Apprenants

Avis

Pour ajouter un avis sur le cours, vous devez d'abord vous connecter. Connectez-vous ici

Caractéristiques du cours

  • Durée 6-12 hour
  • Language Français
  • Niveau de compétence.
  • CertificateNon
  • Nombre maximum d'inscrits
  • Type de formation

Devenir enseignant, Partagez vos connaissances

Rejoignez OpenskillRoom, la plateforme de formations synchrones qui valorise votre expertise.