Générer un heatmap dans MatPlotLib à l'aide d'un éparpillement de l'ensemble de données

J'ai un ensemble de données X,Y des points (environ 10k) qui sont faciles à tracer un diagramme de dispersion mais que je voudrais représenter comme une heatmap.

J'ai regardé à travers les exemples de MatPlotLib et ils semblent tous d'ores et déjà commencer avec heatmap les valeurs des cellules pour générer l'image.

Est là une méthode qui convertit un tas de x,y, tous différents, pour une heatmap (où les zones avec une fréquence plus élevée de x,y serait plus "chaudes")?

Tout aussi pertinente: méthode Efficace de calcul de la densité de points espacés de manière irrégulière

InformationsquelleAutor greye | 2010-03-03

169

Si vous ne voulez pas d'hexagones, vous pouvez utiliser numpy est histogram2d fonction:
```
import numpy as np
import numpy.random
import matplotlib.pyplot as plt

# Generate some test data
x = np.random.randn(8873)
y = np.random.randn(8873)

heatmap, xedges, yedges = np.histogram2d(x, y, bins=50)
extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]]

plt.clf()
plt.imshow(heatmap.T, extent=extent, origin='lower')
plt.show()
```
Cela fait une 50x50 heatmap. Si vous voulez, par exemple, 512x384, vous pouvez mettre bins=(512, 384) dans l'appel à histogram2d.

Exemple:
- Je ne veux pas être un idiot, mais comment fait-on pour avoir cette sortie à un PNG/PDF fichier au lieu de l'affichage interactif IPython session? J'essaie de faire cela comme une sorte de normal axes exemple, où je peux ajouter un titre, des étiquettes de l'axe, etc. et puis faire de la normale savefig() comme je le ferais pour n'importe quel autre typique matplotlib de la parcelle.
- ne pas plt.savefig('filename.png') travail? Si vous souhaitez obtenir un des axes de l'instance, l'utilisation Matplotlib est une interface orientée objet: fig = plt.figure() ax = fig.gca() ax.imshow(...) fig.savefig(...)
- En effet, merci! Je suppose que je ne suis pas entièrement comprendre que imshow() est sur la même catégorie de fonctions, comme scatter(). Honnêtement, je ne comprends pas pourquoi imshow() convertit un tableau 2d de chars dans des blocs de couleur appropriée, tandis que moi, je ne comprends ce que scatter() est censé faire avec un tel tableau.
- Un avertissement sur l'utilisation imshow pour tracer un histogramme 2d de x/y des valeurs de ce type: par défaut, imshow parcelles à l'origine dans le coin supérieur gauche et transpose l'image. Ce que je voudrais faire pour obtenir la même orientation que d'un nuage de points est plt.imshow(heatmap.T, extent=extent, origin = 'lower')
- Pour ceux qui veulent faire un logarithmique de la barre de couleur le voir, cette question stackoverflow.com/questions/17201172/... et tout simplement from matplotlib.colors import LogNorm plt.imshow(heatmap, norm=LogNorm()) plt.colorbar()
- Est-il de toute façon on peut ajouter un arrière-plan d'une image statique dans la chaleur des cartes ??
- J'ai essayé et mon gelé due à une erreur de mémoire insuffisante...
InformationsquelleAutor ptomato
105

Dans Matplotlib lexique, je pense que vous voulez un hexbin de la parcelle.

Si vous n'êtes pas familier avec ce type de tracé, c'est juste un bivariée histogramme dans lequel le plan xy est pavée par une grille d'hexagones.

Donc à partir d'un histogramme, vous pouvez simplement compter le nombre de points de chute dans chaque hexagone, discretiize le tracé de la région comme un ensemble de windows, d'attribuer à chaque point de l'une de ces fenêtres; enfin, la carte de la windows sur un gamme de couleurs, et vous avez un hexbin diagramme.

Bien que moins fréquemment utilisés que par exemple, des cercles ou des carrés, que les hexagones sont un meilleur choix pour la géométrie de la zone de binning conteneur est intuitive:
- hexagones ont le plus proche voisin de symétrie (par exemple, le carré des bacs de ne pas,
  par exemple, la distance de un point sur un carré de la frontière à un point
  à l'intérieur de ce carré n'est pas égale partout dans le monde) et
- hexagone est le plus élevé n-polygone qui donne régulier d'avion
  pavage (c'est à dire, vous pouvez re-modèle de votre plancher de la cuisine hexagonale en forme de tuiles, car vous n'aurez pas d'espace vide entre les tuiles lorsque vous avez terminé--pas vrai pour tous les autres supérieur à n, n >= 7, polygones).
(Matplotlib utilise le terme hexbin parcelle, afin de faire (autant que je sache) tous les traçage des bibliothèques pour R; je ne sais pas si c'est le terme généralement accepté pour les parcelles de ce type, bien que je soupçonne que c'est possible étant donné que hexbin est court pour hexagonale binning, qui est décrit l'étape essentielle de la préparation des données pour l'affichage.)
```
from matplotlib import pyplot as PLT
from matplotlib import cm as CM
from matplotlib import mlab as ML
import numpy as NP

n = 1e5
x = y = NP.linspace(-5, 5, 100)
X, Y = NP.meshgrid(x, y)
Z1 = ML.bivariate_normal(X, Y, 2, 2, 0, 0)
Z2 = ML.bivariate_normal(X, Y, 4, 1, 1, 1)
ZD = Z2 - Z1
x = X.ravel()
y = Y.ravel()
z = ZD.ravel()
gridsize=30
PLT.subplot(111)

# if 'bins=None', then color of each hexagon corresponds directly to its count
# 'C' is optional--it maps values to x-y coordinates; if 'C' is None (default) then 
# the result is a pure 2D histogram 

PLT.hexbin(x, y, C=z, gridsize=gridsize, cmap=CM.jet, bins=None)
PLT.axis([x.min(), x.max(), y.min(), y.max()])

cb = PLT.colorbar()
cb.set_label('mean value')
PLT.show()   
```
- Que signifie le fait que "les hexagones ont le plus proche voisin de symétrie"? Vous dites que "la distance d'un point sur un carré de la frontière et un point à l'intérieur de ce carré n'est pas égale partout dans le monde", mais la distance à quoi?
- Pour un hexagone, la distance de centre à un sommet de joindre les deux côtés est également plus que du centre au milieu d'un côté, le ratio est plus faible (2/sqrt(3) ≈ 1.15 pour l'hexagone contre sqrt(2) ≈ 1,41 pour le carré). La seule forme où la distance entre le centre de chaque point de la frontière est de l'égalité est le cercle.
- Pour un hexagone, chaque voisin est à la même distance. Il n'y a pas de problème avec le 8-voisinage ou de 4-quartier. Pas de diagonale voisins, juste une sorte de voisin.
- Comment choisissez-vous la gridsize= paramètre. Je voudrais choisir un tel, de sorte que les hexagones, il suffit de toucher sans qu'elles se chevauchent. J'ai remarqué que gridsize=100 permettrait de produire de petits hexagones, mais comment choisir la bonne valeur?
InformationsquelleAutor doug

Au lieu d'utiliser des np.hist2d, qui, en général, produit tout à fait laid histogrammes, je voudrais recycler py-sphviewer, un paquet python pour le rendu des particules de simulations à l'aide d'une adaptative lissage par noyau et qui peut être facilement installé par le programme pep (voir page de documentation). Considérons le code suivant, qui est basé sur l'exemple:

import numpy as np
import numpy.random
import matplotlib.pyplot as plt
import sphviewer as sph
def myplot(x, y, nb=32, xsize=500, ysize=500):   
xmin = np.min(x)
xmax = np.max(x)
ymin = np.min(y)
ymax = np.max(y)
x0 = (xmin+xmax)/2.
y0 = (ymin+ymax)/2.
pos = np.zeros([3, len(x)])
pos[0,:] = x
pos[1,:] = y
w = np.ones(len(x))
P = sph.Particles(pos, w, nb=nb)
S = sph.Scene(P)
S.update_camera(r='infinity', x=x0, y=y0, z=0, 
xsize=xsize, ysize=ysize)
R = sph.Render(S)
R.set_logscale()
img = R.get_image()
extent = R.get_extent()
for i, j in zip(xrange(4), [x0,x0,y0,y0]):
extent[i] += j
print extent
return img, extent
fig = plt.figure(1, figsize=(10,10))
ax1 = fig.add_subplot(221)
ax2 = fig.add_subplot(222)
ax3 = fig.add_subplot(223)
ax4 = fig.add_subplot(224)
# Generate some test data
x = np.random.randn(1000)
y = np.random.randn(1000)
#Plotting a regular scatter plot
ax1.plot(x,y,'k.', markersize=5)
ax1.set_xlim(-3,3)
ax1.set_ylim(-3,3)
heatmap_16, extent_16 = myplot(x,y, nb=16)
heatmap_32, extent_32 = myplot(x,y, nb=32)
heatmap_64, extent_64 = myplot(x,y, nb=64)
ax2.imshow(heatmap_16, extent=extent_16, origin='lower', aspect='auto')
ax2.set_title("Smoothing over 16 neighbors")
ax3.imshow(heatmap_32, extent=extent_32, origin='lower', aspect='auto')
ax3.set_title("Smoothing over 32 neighbors")
#Make the heatmap using a smoothing over 64 neighbors
ax4.imshow(heatmap_64, extent=extent_64, origin='lower', aspect='auto')
ax4.set_title("Smoothing over 64 neighbors")
plt.show()

qui produit l'image suivante:

Générer un heatmap dans MatPlotLib à l'aide d'un éparpillement de l'ensemble de données

Comme vous le voyez, les images ont l'air assez sympa, et nous sommes en mesure d'identifier les différentes sous-structures sur elle. Ces images sont construites à la propagation d'un poids donné, pour chaque point à l'intérieur d'un certain domaine, défini par le lissage de la longueur, qui s'est donnée par la distance de la plus proche nb voisin (j'ai choisi de 16, 32 et 64 pour les exemples). Ainsi, plus la densité habituellement, les régions sont répartis dans de petites régions par rapport à la densité plus faible des régions.

La fonction myplot est juste une fonction très simple que j'ai écrit afin de donner les données x,y à py-sphviewer à faire de la magie.

Un commentaire pour toute personne essayant d'installer py-sphviewer sur OSX: j'ai eu beaucoup de difficulté, voir: github.com/alejandrobll/py-sphviewer/issues/3
Dommage qu'il ne fonctionne pas avec python3. Il s'installe, mais puis se bloque lorsque vous essayez de l'utiliser...
Dias, La dernière version (1.1.x) est maintenant compatible avec Python 3.

InformationsquelleAutor Alejandro

Si vous utilisez 1.2.x

import numpy as np
import matplotlib.pyplot as plt
x = np.random.randn(100000)
y = np.random.randn(100000)
plt.hist2d(x,y,bins=100)
plt.show()

Générer un heatmap dans MatPlotLib à l'aide d'un éparpillement de l'ensemble de données

InformationsquelleAutor Piti Ongmongkolkul

24

Edit: Pour une meilleure approximation de Alejandro réponse, voir ci-dessous.

Je sais que c'est une vieille question, mais je voulais ajouter quelque chose à Alejandro anwser: Si vous voulez une belle image lissée sans l'aide de py-sphviewer place, vous pouvez utiliser np.histogram2d et appliquer un filtre gaussien (de scipy.ndimage.filters) à la heatmap:
```
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.cm as cm
from scipy.ndimage.filters import gaussian_filter
def myplot(x, y, s, bins=1000):
heatmap, xedges, yedges = np.histogram2d(x, y, bins=bins)
heatmap = gaussian_filter(heatmap, sigma=s)
extent = [xedges[0], xedges[-1], yedges[0], yedges[-1]]
return heatmap.T, extent
fig, axs = plt.subplots(2, 2)
# Generate some test data
x = np.random.randn(1000)
y = np.random.randn(1000)
sigmas = [0, 16, 32, 64]
for ax, s in zip(axs.flatten(), sigmas):
if s == 0:
ax.plot(x, y, 'k.', markersize=5)
ax.set_title("Scatter plot")
else:
img, extent = myplot(x, y, s)
ax.imshow(img, extent=extent, origin='lower', cmap=cm.jet)
ax.set_title("Smoothing with  $\sigma$ = %d" % s)
plt.show()
```
Produit:

Le diagramme de dispersion et s=16 tracées sur eachother pour Agape Gal'lo (cliquez pour mieux voir):

Une différence que j'ai remarqué avec mon filtre gaussien approche et Alejandro était que sa méthode montre de structures locales, beaucoup mieux que le mien. J'ai donc mis en place un simple voisin le plus proche de la méthode au niveau du pixel. Cette méthode calcule pour chaque pixel de l'inverse de la somme des distances de l' n points les plus proches dans les données. Cette méthode est à un niveau de résolution assez gourmand en ressources et je pense qu'il y a un moyen plus rapide, alors laissez-moi savoir si vous avez des améliorations. De toute façon, voici le code:
```
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.cm as cm
def data_coord2view_coord(p, vlen, pmin, pmax):
dp = pmax - pmin
dv = (p - pmin) / dp * vlen
return dv
def nearest_neighbours(xs, ys, reso, n_neighbours):
im = np.zeros([reso, reso])
extent = [np.min(xs), np.max(xs), np.min(ys), np.max(ys)]
xv = data_coord2view_coord(xs, reso, extent[0], extent[1])
yv = data_coord2view_coord(ys, reso, extent[2], extent[3])
for x in range(reso):
for y in range(reso):
xp = (xv - x)
yp = (yv - y)
d = np.sqrt(xp**2 + yp**2)
im[y][x] = 1 / np.sum(d[np.argpartition(d.ravel(), n_neighbours)[:n_neighbours]])
return im, extent
n = 1000
xs = np.random.randn(n)
ys = np.random.randn(n)
resolution = 250
fig, axes = plt.subplots(2, 2)
for ax, neighbours in zip(axes.flatten(), [0, 16, 32, 64]):
if neighbours == 0:
ax.plot(xs, ys, 'k.', markersize=2)
ax.set_aspect('equal')
ax.set_title("Scatter Plot")
else:
im, extent = nearest_neighbours(xs, ys, resolution, neighbours)
ax.imshow(im, origin='lower', extent=extent, cmap=cm.jet)
ax.set_title("Smoothing over %d neighbours" % neighbours)
ax.set_xlim(extent[0], extent[1])
ax.set_ylim(extent[2], extent[3])
plt.show()
```
Résultat:
- L'amour ce. Le graphique est aussi beau que Alejandro réponse, mais pas de nouveaux paquets nécessaires.
- Très sympa ! Mais vous générer un décalage avec cette méthode. Vous pouvez le voir en comparant normal d'un graphique en nuage de points avec la couleur. Pourriez-vous ajouter quelque chose pour y remédier ? Ou tout simplement pour déplacer le graphique par les valeurs x et y ?
- Agape Gal'lo, que voulez-vous dire avec un décalage? Si vous tracez sur eachother de correspondance (voir l'edit de mon post). Vous êtes peut-être mis hors de cause la largeur de l'éparpillement ne correspond pas exactement avec les trois autres.
- Merci beaucoup pour le traçage du graphique juste pour moi ! J'ai compris mon erreur: j'avais modifié la "mesure" pour définir les coordonnées x et y des limites. Je comprends maintenant qu'il a modifié l'origine du graphique. Ensuite, j'ai une dernière question: comment puis-je élargir les limites du graphique, même pour la zone où il n'y a pas de données existantes ? Par exemple, entre -5 et +5 pour x et y.
- Dites que vous voulez l'axe des x pour aller de -5 à 5 et l'axe des y de -3 à 4; dans le myplot fonction, ajoutez le range paramètre np.histogram2d: np.histogram2d(x, y, bins=bins, range=[[-5, 5], [-3, 4]]) et dans la boucle for définir les coordonnées x et y de la mfr de l'axe: ax.set_xlim([-5, 5]) ax.set_ylim([-3, 4]). De plus, par défaut, imshow conserve le ratio d'aspect identique au ratio de vos axes (donc dans mon exemple, un ratio de 10:7), mais si vous voulez qu'il corresponde à votre fenêtre du tracé, ajoutez le paramètre aspect='auto' à imshow.
InformationsquelleAutor Jurgy
15

Seaborn a maintenant la jointplot fonction qui devrait fonctionner bien ici:
```
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
# Generate some test data
x = np.random.randn(8873)
y = np.random.randn(8873)
sns.jointplot(x=x, y=y, kind='hex')
plt.show()
```
- Simple, joli et analytique utile.
- comment faire d'un 600k visuellement des données lisibles à l'aide de cette? (comment redimensionner)
- Je ne suis pas tout à fait sûr de ce que tu veux dire; peut-être il est préférable de vous poser une question distincte et lien ici. Tu veux dire redimensionner la fig? D'abord faire une figure avec fig = plt.figure(figsize=(12, 12)), puis obtenir de l'axe actuel avec ax=plt.gca(), puis ajouter l'argument ax=ax à la jointplot fonction.
- pourriez-vous s'il vous plaît répondre à cette question: stackoverflow.com/questions/50997662/... merci
InformationsquelleAutor wordsforthewise
4

et la question initiale a été... comment faire pour convertir de dispersion des valeurs de valeurs de grille, à droite?
histogram2d ne compter la fréquence par cellule, cependant, si vous avez d'autres données par cellule que juste la fréquence, vous auriez besoin de plus de travail à faire.
```
x = data_x # between -10 and 4, log-gamma of an svc
y = data_y # between -4 and 11, log-C of an svc
z = data_z #between 0 and 0.78, f1-values from a difficult dataset
```
Donc, j'ai un dataset avec Z-résultats pour les coordonnées X et Y. Cependant, j'ai été le calcul de quelques points à l'extérieur de la zone d'intérêt (grands espaces), et des tas de points dans une petite zone d'intérêt.

Oui ici, il devient plus difficile mais aussi plus amusant. Certaines bibliothèques (désolé):
```
from matplotlib import pyplot as plt
from matplotlib import cm
import numpy as np
from scipy.interpolate import griddata
```
pyplot est mon moteur graphique d'aujourd'hui,
la cm est une gamme de cartes de couleurs avec quelques initeresting choix.
numpy pour les calculs,
et griddata pour la fixation des valeurs d'une grille fixe.

Le dernier est important, surtout parce que la fréquence de xy des points n'est pas également répartie dans mes données. Tout d'abord, nous allons commencer avec quelques limites montage de mes données et de l'arbitraire de la taille de la grille. Les données d'origine a points de données également en dehors de ces x et y des limites.
```
#determine grid boundaries
gridsize = 500
x_min = -8
x_max = 2.5
y_min = -2
y_max = 7
```
Nous avons donc défini une grille avec 500 pixels entre les valeurs min et max de x et y.

Dans mes données, il y a beaucoup plus de 500 valeurs disponibles dans la zone d'un grand intérêt; alors que dans le faible taux d'intérêt de la zone, il y a même pas 200 valeurs dans la grille total; entre les graphiques des limites de x_min et x_max il y a encore moins.

Donc, pour obtenir une belle image, la tâche est d'obtenir une moyenne pour l'intérêt supérieur de valeurs et de combler les lacunes d'ailleurs.

Je définir ma grille de maintenant. Pour chaque xx-yy paire, je veux avoir une couleur.
```
xx = np.linspace(x_min, x_max, gridsize) # array of x values
yy = np.linspace(y_min, y_max, gridsize) # array of y values
grid = np.array(np.meshgrid(xx, yy.T))
grid = grid.reshape(2, grid.shape[1]*grid.shape[2]).T
```
Pourquoi la forme étrange? scipy.griddata veut une forme de (n, D).

Griddata calcule une valeur pour chaque point de la grille, par une méthode prédéfini.
- Je choisir "le plus proche" vide", les points de la grille sera remplie avec les valeurs de la voisine la plus proche. C'est comme si les zones avec moins d'informations ont plus de cellules (même si ce n'est pas le cas). On pourrait choisir pour interpoler "linéaire", puis des zones avec moins d'informations, semble moins forte. Question de goût, vraiment.
```
points = np.array([x, y]).T # because griddata wants it that way
z_grid2 = griddata(points, z, grid, method='nearest')
# you get a 1D vector as result. Reshape to picture format!
z_grid2 = z_grid2.reshape(xx.shape[0], yy.shape[0])
```
Et hop, nous matplotlib pour afficher l'intrigue
```
fig = plt.figure(1, figsize=(10, 10))
ax1 = fig.add_subplot(111)
ax1.imshow(z_grid2, extent=[x_min, x_max,y_min, y_max,  ],
origin='lower', cmap=cm.magma)
ax1.set_title("SVC: empty spots filled by nearest neighbours")
ax1.set_xlabel('log gamma')
ax1.set_ylabel('log C')
plt.show()
```
Autour de l'pointu partie de la Forme de V, vous voyez j'ai fait beaucoup de calculs lors de mes recherches pour le sweet spot, tandis que la moins intéressante de pièces, presque partout ailleurs, ont une résolution inférieure.
- Pouvez-vous améliorer votre réponse à compléter et praticable code? C'est une méthode intéressante que vous avez fournis. Je suis en train d'essayer de mieux le comprendre pour le moment. Je n'arrive pas à comprendre pourquoi il y a une forme de V, soit. Merci.
- La Forme en V vient de mes données. C'est la f1-valeur pour une formation de SVM: C'est aller un peu dans la théorie de la SVM est. Si vous avez une haute C, il comprend tous vos points dans le calcul, permettant ainsi d'un plus large gamme gamma de travail. Gamma est la raideur de la courbe de séparer les bons et les mauvais. Ces deux valeurs doivent être donnés à la SVM (X et Y dans mon graphique); ensuite, vous obtenez un résultat (Z dans mon graphique). Dans la meilleure zone que vous obtenez espérons-le, à des hauteurs.
- deuxième essai: La Forme en V est dans mes données. C'est la f1-valeur pour un SVM: Si vous avez une haute C, il comprend tous vos points dans le calcul, permettant ainsi d'un plus large gamme gamma de travail, mais en faisant le calcul lent. Gamma est la raideur de la courbe de séparer les bons et les mauvais. Ces deux valeurs doivent être donnés à la SVM (X et Y dans mon graphique); ensuite, vous obtenez un résultat (Z dans mon graphique). Dans l'optimisation de la zone que vous obtenez des valeurs élevées, ailleurs de faibles valeurs. Ce que j'ai montré ici est utilisable que si vous avez les valeurs Z pour certains (X, Y) et de nombreuses lacunes ailleurs. Si vous avez (X,Y,Z) des points de données, vous pouvez utiliser mon code.
InformationsquelleAutor Anderas
2

Faire un tableau en 2 dimensions qui correspond aux cellules de votre image finale, appelé à dire heatmap_cells et de l'instancier comme tous les zéros.

Choisir deux facteurs d'échelle qui définissent la différence entre chaque élément du tableau en unités réelles, pour chaque dimension, disons x_scale et y_scale. Choisir de tels que tous vos points de données va tomber dans les limites de la heatmap tableau.

Pour chaque raw datapoint avec x_value et y_value:

heatmap_cells[floor(x_value/x_scale),floor(y_value/y_scale)]+=1
- Numpy a une fonction pour ça...
InformationsquelleAutor meepmeep

Très similaire à @Piti réponse, mais à l'aide de 1 appel, au lieu de 2 pour générer les points:

import numpy as np
import matplotlib.pyplot as plt
pts = 1000000
mean = [0.0, 0.0]
cov = [[1.0,0.0],[0.0,1.0]]
x,y = np.random.multivariate_normal(mean, cov, pts).T
plt.hist2d(x, y, bins=50, cmap=plt.cm.jet)
plt.show()

De sortie:

Générer un heatmap dans MatPlotLib à l'aide d'un éparpillement de l'ensemble de données

InformationsquelleAutor Alaa M.

Je crains que je suis un peu en retard à la fête, mais j'ai eu une question similaire il y a longtemps. La accepté de répondre (par @ptomato) m'a beaucoup aidé, mais j'avais aussi envie de poster ceci dans le cas où il est d'usage à quelqu'un.


''' I wanted to create a heatmap resembling a football pitch which would show the different actions performed '''
import numpy as np
import matplotlib.pyplot as plt
import random
#fixing random state for reproducibility
np.random.seed(1234324)
fig = plt.figure(12)
ax1 = fig.add_subplot(121)
ax2 = fig.add_subplot(122)
#Ratio of the pitch with respect to UEFA standards 
hmap= np.full((6, 10), 0)
#print(hmap)
xlist = np.random.uniform(low=0.0, high=100.0, size=(20))
ylist = np.random.uniform(low=0.0, high =100.0, size =(20))
#UEFA Pitch Standards are 105m x 68m
xlist = (xlist/100)*10.5
ylist = (ylist/100)*6.5
ax1.scatter(xlist,ylist)
#int of the co-ordinates to populate the array
xlist_int = xlist.astype (int)
ylist_int = ylist.astype (int)
#print(xlist_int, ylist_int)
for i, j in zip(xlist_int, ylist_int):
#this populates the array according to the x,y co-ordinate values it encounters 
hmap[j][i]= hmap[j][i] + 1   
#Reversing the rows is necessary 
hmap = hmap[::-1]
#print(hmap)
im = ax2.imshow(hmap)

Voici le résultat
Générer un heatmap dans MatPlotLib à l'aide d'un éparpillement de l'ensemble de données

InformationsquelleAutor Abhishek

0

Voici celui que j'ai fait sur un de 1 Million de points de l'ensemble avec 3 catégories (de couleur Rouge, Vert et Bleu). Voici un lien vers le référentiel si vous souhaitez essayer la fonction. Dépôt Github
```
histplot(
X,
Y,
labels,
bins=2000,
range=((-3,3),(-3,3)),
normalize_each_label=True,
colors = [
[1,0,0],
[0,1,0],
[0,0,1]],
gain=50)
```
InformationsquelleAutor Joel Stansbury

Vous devez vous connecter pour publier un commentaire.