Projet : Analyse de données en apprentissage automatique pour résoudre des problèmes de classification et de clustering dans le domaine de la santé

Ce projet a été réalisé par :

Elghazi Soufiane
Amine Maasri
Ibtissam Labyady

Dans ce projet, nous avons analysé des données dans le domaine de la santé, en particulier la classification de la santé fœtale, en utilisant des techniques d'apprentissage automatique. Nous avons exploré différentes techniques de classification et de clustering pour résoudre des problèmes spécifiques dans ce domaine, les avons évaluées et avons présenté les résultats à interpréter.

Dataset

Le lien vers le jeu de données : Fetal Health Classification | Kaggle

Contexte

La réduction de la mortalité infantile est un objectif clé du développement durable des Nations Unies et un indicateur important du progrès humain. L'ONU prévoit que d'ici 2030, tous les pays chercheront à mettre fin aux décès évitables de nouveau-nés et d'enfants de moins de 5 ans, en réduisant la mortalité des moins de 5 ans à au moins 25 pour 1 000 naissances vivantes.

Les cardiotocogrammes (CTG) sont une méthode simple et abordable pour évaluer la santé fœtale, permettant aux professionnels de la santé de prendre des mesures pour prévenir la mortalité infantile et maternelle. Les CTG fonctionnent en envoyant des impulsions ultrasonores et en lisant les réponses, fournissant des informations sur la fréquence cardiaque fœtale (FHR), les mouvements fœtaux, les contractions utérines, etc.

Données

Ce jeu de données contient 2126 enregistrements d'examens de cardiotocogrammes, avec des caractéristiques extraites et classées en 3 classes par trois experts obstétriciens :

Normal
Suspect
Pathologique

Fonctionnalités du code

Ce code est une application Streamlit qui effectue les tâches suivantes sur les données de santé fœtale :

EDA (Analyse exploratoire des données) : Le code charge un ensemble de données à partir d'un fichier CSV et affiche les données dans un DataFrame à l'aide de la bibliothèque Pandas. Il affiche également une heatmap de corrélation pour visualiser les relations entre les variables.
Classification : Le code charge des modèles de classification (KNN, arbre de décision, régression logistique, forêt aléatoire, SVM et Naive Bayes) à partir de fichiers pickle préalablement enregistrés. Il permet à l'utilisateur de sélectionner un modèle, de définir les paramètres du modèle et de prédire la classe de sortie en utilisant les données de test. Le code affiche ensuite une matrice de confusion, les prédictions et les valeurs réelles, ainsi que la précision du modèle.
Clustering : Le code charge des modèles de clustering (K-means, clustering hiérarchique et DBSCAN) à partir de fichiers pickle préalablement enregistrés. Il permet à l'utilisateur de choisir un modèle, de définir les paramètres du modèle et de générer les clusters à partir des données d'entrée. Les résultats sont affichés sous forme de graphiques de dispersion.

En résumé, ce code combine des fonctionnalités d'EDA, de classification et de clustering pour analyser un ensemble de données de santé fœtale, fournir des visualisations et des prédictions à l'utilisateur.

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
.gitignore		.gitignore
Agglomorative.pkl		Agglomorative.pkl
Arbre de décision.pkl		Arbre de décision.pkl
Classifif=cation ameliore.ipynb		Classifif=cation ameliore.ipynb
DBSCAN.pkl		DBSCAN.pkl
Descriptif_ProjetML.pdf		Descriptif_ProjetML.pdf
Forêt aléatoire.pkl		Forêt aléatoire.pkl
KNN.pkl		KNN.pkl
Kmeans.pkl		Kmeans.pkl
Livrable_Finale.ipynb		Livrable_Finale.ipynb
Livrable_Finale_ML.ipynb		Livrable_Finale_ML.ipynb
Naive Bayes.pkl		Naive Bayes.pkl
Projet.iml		Projet.iml
README.md		README.md
Régression logistique.pkl		Régression logistique.pkl
SVM.pkl		SVM.pkl
application.py		application.py
fetal_health.csv		fetal_health.csv
icons8_user.ico		icons8_user.ico
icons8_user_16.png		icons8_user_16.png
livrable2.ipynb		livrable2.ipynb
misc.xml		misc.xml
modules.xml		modules.xml
profiles_settings.xml		profiles_settings.xml
requirements.txt		requirements.txt
workspace.xml		workspace.xml

ibtissam01/Fetale_health-_-classifiaction-clusterng

Folders and files

Latest commit

History

Repository files navigation

Projet : Analyse de données en apprentissage automatique pour résoudre des problèmes de classification et de clustering dans le domaine de la santé

Ce projet a été réalisé par :

Dataset

Contexte

Données

Fonctionnalités du code

About

Topics

Resources

Stars

Watchers

Forks

Languages