Créer numpy matrice remplie avec NaNs

J'ai le code suivant:

r = numpy.zeros(shape = (width, height, 9))

Il crée un width x height x 9 matrice rempli avec des zéros. Au lieu de cela, je voudrais savoir si il existe une fonction ou une façon de les initialiser à la place de NaNs dans un moyen facile.

Une mise en garde est que NumPy n'ont pas un nombre entier NA de valeur (contrairement à R). Voir pandas liste des erreurs. Donc np.nan se passe mal lors de la conversion de int.
smci est droit. Pour NumPy il n'y a pas une telle valeur NaN. Donc, cela dépend du type et de la sur NumPy dont la valeur sera là pour NaN. Si vous n'êtes pas conscient de cela, cela va causer des ennuis

InformationsquelleAutor devoured elysium | 2009-11-10

numpy python

235

Vous aurez rarement besoin de boucles pour les opérations de numpy.
Vous pouvez créer un tableau non initialisé et de céder à toutes les entrées à la fois:
```
>>> a = numpy.empty((3,3,))
>>> a[:] = numpy.nan
>>> a
array([[ NaN,  NaN,  NaN],
       [ NaN,  NaN,  NaN],
       [ NaN,  NaN,  NaN]])
```
J'ai chronométré les alternatives a[:] = numpy.nan ici et a.fill(numpy.nan) posté par Blaenk:
```
$ python -mtimeit "import numpy as np; a = np.empty((100,100));" "a.fill(np.nan)"
10000 loops, best of 3: 54.3 usec per loop
$ python -mtimeit "import numpy as np; a = np.empty((100,100));" "a[:] = np.nan" 
10000 loops, best of 3: 88.8 usec per loop
```
Les horaires indiquent une préférence pour les ndarray.fill(..) comme l'alternative plus rapide. Otoh, que, j'aime numpy la commodité de mise en œuvre de l'endroit où vous pouvez affecter des valeurs à l'ensemble de tranches à la fois, le code de l'intention est très claire.
- Je suis d'accord que le code de l'intention est claire. Mais merci pour la neutralité timings (ou plutôt, le fait que vous avez encore posté), je l'apprécie 🙂
- J'aime celui-ci: a = numpy.empty((3, 3,)) * numpy.nan. Il chronométrés plus vite que fill mais plus lente que la méthode d'affectation, mais c'est un oneliner!!
- S'il vous plaît regardez cette réponse: stackoverflow.com/questions/10871220/...
- Je préfère le .fill() méthode, mais la différence de vitesse réduit à presque rien comme les tableaux sont de plus en plus.
- Pourquoi ne pas combiner les deux? np.empty([2, 5]).fill(np.nan)? Cela renvoie None, et je ne sais pas pourquoi...
- ... parce que np.empty([2, 5]) crée un tableau, puis fill() modifie la matrice en place, mais ne retourne pas une copie ou une référence. Si vous voulez l'appeler np.empty(2, 5) par un nom ("associer à une variable"), vous devez le faire avant de le faire sur place les opérations sur elle. Même genre de chose se produit si vous ne [1, 2, 3].insert(1, 4). La liste est créée et un 4 est insérée, mais il est impossible d'obtenir une référence à la liste (et donc il peut être supposé que le garbage collector). Sur les données immuables comme les cordes, un exemplaire est retourné, parce que vous ne pouvez pas opérer sur place. Les Pandas peuvent faire les deux.
- Être conscient de NaN dans NumPy. Il n'y a pas de nombre. Donc, pas de vérification, il peut louper.
InformationsquelleAutor u0b34a0f6ae
137

Une autre option est d'utiliser numpy.plein, une option disponible dans NumPy 1.8+
```
a = np.full([height, width, 9], np.nan)
```
C'est assez flexible et vous pouvez le remplir avec n'importe quel autre nombre que vous voulez.
- Je considérerais cela comme le correct réponse car il est eactly ce full est destiné. np.empy((x,y))*np.nan est un bon coureur (et leur compatibilité avec les anciennes versions de numpy).
- c'est plus lent que fill python -mtimeit "import numpy as np; a = np.empty((100,100));" "a.fill(np.nan)" 100000 loops, best of 3: 13.3 usec per loop python -mtimeit "import numpy as np; a = np.full((100,100), np.nan);" 100000 loops, best of 3: 18.5 usec per loop
- Si vous mettez le code équivalent insiding le moment en boucle qu'ils sont sur la même. Les deux méthodes sont fondamentalement les mêmes, vous avez juste le "np.vide" à l'extérieur de la minuterie dans le premier. python -mtimeit "import numpy as np; a = np.empty((1000,1000)); a.fill(np.nan)" 1000 loops, best of 3: 381 usec per loop $ python -mtimeit "import numpy as np; a = np.full((1000,1000), np.nan);" 1000 loops, best of 3: 383 usec per loop
InformationsquelleAutor pietro

J'ai comparé les solutions de rechange proposées pour la vitesse et a constaté que, pour assez grand vecteurs/matrices à remplir, toutes les solutions de rechange à l'exception val * ones et array(n * [val]) sont tout aussi rapides.

Créer numpy matrice remplie avec NaNs

Code de reproduire la parcelle:

import numpy
import perfplot

val = 42.0


def fill(n):
    a = numpy.empty(n)
    a.fill(val)
    return a


def colon(n):
    a = numpy.empty(n)
    a[:] = val
    return a


def full(n):
    return numpy.full(n, val)


def ones_times(n):
    return val * numpy.ones(n)


def list(n):
    return numpy.array(n * [val])


perfplot.show(
    setup=lambda n: n,
    kernels=[fill, colon, full, ones_times, list],
    n_range=[2**k for k in range(20)],
    logx=True,
    logy=True,
    xlabel='len(a)'
    )

Étrange que numpy.full(n, val) est plus lent que a = numpy.empty(n) .. a.fill(val) depuis il fait la même chose en interne

InformationsquelleAutor Nico Schlömer

25

Êtes-vous familier avec numpy.nan?

Vous pouvez créer votre propre méthode telle que:
```
def nans(shape, dtype=float):
    a = numpy.empty(shape, dtype)
    a.fill(numpy.nan)
    return a
```
Puis
```
nans([3,4])
```
serait sortie de
```
array([[ NaN,  NaN,  NaN,  NaN],
       [ NaN,  NaN,  NaN,  NaN],
       [ NaN,  NaN,  NaN,  NaN]])
```
J'ai trouvé ce code dans un liste de diffusion thread.
- Semble exagéré.
- Cela dépend de votre situation. Si vous devez les initialiser un seul NaN tableau, alors oui, une fonction personnalisée est probablement excessif. Toutefois, si vous devez les initialiser un NaN tableau à plusieurs endroits dans votre code, puis d'avoir cette fonction est très pratique.
- Pas vraiment, étant donné qu'un plus souple et plus efficace version d'une telle fonction existe déjà et qui est mentionnée dans plusieurs autres réponses.
InformationsquelleAutor Jorge Israel Peña

Vous pouvez toujours utiliser la multiplication si vous n'avez pas immédiatement rappeler le .empty ou .full méthodes:

>>> np.nan * np.ones(shape=(3,2))
array([[ nan,  nan],
       [ nan,  nan],
       [ nan,  nan]])

Bien sûr, il fonctionne avec n'importe quelle autre valeur numérique ainsi:

>>> 42 * np.ones(shape=(3,2))
array([[ 42,  42],
       [ 42,  42],
       [ 42, 42]])

Mais l' @u0b34a0f6ae de accepté de répondre à est 3x plus rapide (nombre de cycles CPU, pas de cerveau cycles de rappeler numpy syntaxe ;):

$ python -mtimeit "import numpy as np; X = np.empty((100,100));" "X[:] = np.nan;"
100000 loops, best of 3: 8.9 usec per loop
(predict)laneh@predict:~/src/predict/predict/webapp$ master
$ python -mtimeit "import numpy as np; X = np.ones((100,100));" "X *= np.nan;"
10000 loops, best of 3: 24.9 usec per loop

InformationsquelleAutor hobs

4

Comme l'a dit, numpy.empty() est le chemin à parcourir. Toutefois, pour les objets, de remplissage() peut ne pas faire exactement ce que vous pensez que cela fonctionne:
```
In[36]: a = numpy.empty(5,dtype=object)
In[37]: a.fill([])
In[38]: a
Out[38]: array([[], [], [], [], []], dtype=object)
In[39]: a[0].append(4)
In[40]: a
Out[40]: array([[4], [4], [4], [4], [4]], dtype=object)
```
Un moyen de contourner peuvent être par exemple:
```
In[41]: a = numpy.empty(5,dtype=object)
In[42]: a[:]= [ [] for x in range(5)]
In[43]: a[0].append(4)
In[44]: a
Out[44]: array([[4], [], [], [], []], dtype=object)
```
- En plus d'avoir pratiquement rien à voir avec la question d'origine, soigné.
- Eh bien, Il s'agit de "Initialisation de numpy matrice de quelque chose d'autre que zéro ou un", dans la case "autre chose" est un objet 🙂 (Plus concrètement, google m'a amené ici pour l'initialisation d'une liste vide )
InformationsquelleAutor ntg
4

Une autre alternative est numpy.broadcast_to(val,n) qui renvoie en temps constant quelle que soit la taille et est aussi le plus efficace en terme de mémoire (elle renvoie une vue de la répétition de l'élément). Le problème, c'est que la valeur retournée est en lecture seule.

Ci-dessous une comparaison des performances de toutes les autres méthodes qui ont été proposées à l'aide de la même référence que dans Nico Schlömer réponse.

InformationsquelleAutor Giancarlo Sportelli
2

Encore une autre possibilité est pas encore mentionné ici est d'utiliser NumPy tuile:
```
a = numpy.tile(numpy.nan, (3, 3))
```
Donne également
```
array([[ NaN,  NaN,  NaN],
       [ NaN,  NaN,  NaN],
       [ NaN,  NaN,  NaN]])
```
Je ne sais pas sur la comparaison de la vitesse.

InformationsquelleAutor JHBonarius

Vous devez vous connecter pour publier un commentaire.