Python >> Tutoriel Python >  >> Python

Un guide des dendrogrammes en Python

Un dendrogramme est un diagramme qui représente un arbre. Le create_dendrogram figure factory procède à un regroupement hiérarchique des données et représente l'arborescence résultante. Les distances entre les clusters sont représentées par les valeurs sur l'axe de profondeur de l'arbre.

Les tracés de dendrogramme sont souvent utilisés en biologie computationnelle pour représenter le groupement de gènes ou d'échantillons, parfois dans les marges des cartes thermiques.

Le regroupement hiérarchique produit des dendrogrammes en sortie. De nombreuses personnes affirment que les dendrogrammes de ce type peuvent être utilisés pour déterminer le nombre de grappes. Cela n'est vrai, cependant, que lorsque l'inégalité de l'arbre ultramétrique est vérifiée, ce qui est rarement, voire jamais, le cas en pratique.


Tracer un dendrogramme de base en Python

import plotly.figure_factory as ff
import numpy as np
np.random.seed(1)
X = np.random.rand(15, 12) 
fig = ff.create_dendrogram(X)
fig.update_layout(width=800, height=500)
fig.show()

Appliquer le clustering héréditaire et tracer un dendrogramme

Nous utiliserons les méthodes suivantes pour réaliser un regroupement hiérarchique et tracer un dendrogramme :

  1. Le module de hiérarchie fournit des routines pour le clustering hiérarchique et agglomératif.
  2. La méthode scipy.cluster.hierarchy.linkage est utilisée pour effectuer un clustering hiérarchique.
  3. Pour tracer le regroupement hiérarchique sous forme de dendrogramme, la fonction scipy.cluster.hierarchy.dendrogram est utilisée.
import numpy as np
from scipy.cluster import hierarchy
import matplotlib.pyplot as plt
x = np.array([100., 200., 300., 400., 500., 250.,450., 280., 450., 750.])
temp = hierarchy.linkage(x, 'single')
plt.figure()
dn = hierarchy.dendrogram(temp, above_threshold_color="green", color_threshold=.7)

Modifier l'orientation des dendrogrammes

dn = hierarchy.dendrogram(temp, above_threshold_color="green", color_threshold=.7,orientation='right')

Conclusion

Félicitations ! Vous venez d'apprendre à tracer des dendrogrammes en Python. J'espère que vous en avez profité! 😇

Vous avez aimé le tutoriel ? Dans tous les cas, je vous recommande de jeter un œil aux tutoriels mentionnés ci-dessous :

  1. Python Bar Plot – Visualiser des données catégorielles en Python
  2. Comment charger et tracer l'ensemble de données MNIST en Python ?
  3. Top 5 des meilleures bibliothèques Python de traçage et de graphes

Merci d'avoir pris votre temps ! J'espère que vous avez appris quelque chose de nouveau !! 😄