Pour commencer, il faut installer la bibliothèque PySankey sur notre notebook Google Colab :
Ensuite nous allons importer nos données dans le disque dur virtuel de notre notebook Google Colab :
Nous choisissons le fichier PAR_ORIGINES.XLSX :
Une fois installĂ© sur notre disque dur virtuel, nous allons copier le chemin d’accès Ă notre fichier sur le disque dur virtuel car nous l’utiliserons ultĂ©rieurement pour y accĂ©der lors de la crĂ©ation de notre jeu de donnĂ©es :
Avant de crĂ©er notre variable (objet) contenant nos donnĂ©es, nous importons la bibliothèque PANDAS en lui donnant l’alias PD. Nous appellerons DATA notre variable (objet) contenant nos donnĂ©es. Nous prĂ©cisons ici l’emplacement de nos donnĂ©es en copiant le chemin d’accès Ă nos donnĂ©es :
Le contenu des donnĂ©es peut ĂŞtre affichĂ© en appelant l’objet DATA
Le Sankey
Pour dessiner notre sankey, nous allons utiliser la bibliothèque PySankey. Vous pouvez accĂ©der aux dĂ©tails de cette bibliothèque PySankey en utilisant le lien suivant : https://github.com/anazalea/pySankey. Vous trouverez aussi des exemples d’utilisation en cherchant sur Google : https://www.python-graph-gallery.com/basic-sankey-diagram-with-pysankey
Après avoir importĂ© la bibliothèque PySankey et avoir choisi l’importation de sankey, nous crĂ©ons notre graphique en prĂ©cisant l’origine des donnĂ©es se situant Ă gauche, Ă droite, les poids des donnĂ©es ainsi que des dĂ©tails de style d’affichage.
Vous remarquerez que ce graphique est difficilement lisible. Il faudrait ici sélectionner des données plus spécifiques pour que le graphique devienne lisible.
Les donnĂ©es Ă©tant issues d’un DataFrame Pandas, lisez la documentation pandas pour la sĂ©lection des donnĂ©es : https://pandas.pydata.org/
Voir ici comment sĂ©lectionner les lignes d’un DataFrame Pandas : http://www.python-simple.com/python-pandas/dataframes-indexation.php
Exemple de code :
https://github.com/probablyvivek/30-Days-30-Charts-Challenge/blob/main/sankey.ipynb