Numpy: trouver les premier indice de la valeur rapide

Comment puis-je trouver l'index de la première occurrence d'un nombre dans un tableau Numpy?
La vitesse est importante pour moi. Je ne suis pas intéressé par les réponses ci-après parce qu'ils numériser l'ensemble du tableau et ne s'arrêtent pas quand ils trouver la première occurrence:

itemindex = numpy.where(array==item)[0][0]
nonzero(array == item)[0][0]

Note 1: aucune réponse de cette question semble pertinente Est-il un Numpy fonction pour renvoyer le premier indice d'un élément dans un tableau?

Note 2: à l'aide d'un C-compilé méthode est préférable à une boucle Python.

InformationsquelleAutor cyborg | 2011-10-03

54

Il y a une demande de fonctionnalité pour ce prévue pour Numpy 2.0.0: https://github.com/numpy/numpy/issues/2269
- Avance rapide jusqu'en 2018, la question ne semble pas avoir bougé d'un pouce.
- et Numpy est toujours 1.x.x
InformationsquelleAutor cyborg
29

Bien qu'il est trop tard pour vous, mais pour une référence future:
À l'aide de numba (Un) est la façon la plus simple jusqu'à ce que numpy la met en œuvre. Si vous utilisez anaconda python de distribution, il devrait déjà être installé.
Le code sera compilé, donc il sera rapide.
```
@jit(nopython=True)
def find_first(item, vec):
    """return the index of the first occurence of item in vec"""
    for i in xrange(len(vec)):
        if item == vec[i]:
            return i
    return -1
```
et puis:
```
>>> a = array([1,7,8,32])
>>> find_first(8,a)
2
```
- Pour python3 xrange besoin d'être changé pour range.
InformationsquelleAutor tal
19

J'ai fait un benchmark de plusieurs méthodes:
- argwhere
- nonzero comme dans la question
- .tostring() comme dans @Rob Reilink la réponse de
- boucle python
- Fortran boucle
La Python et Fortran code sont disponibles. J'ai sauté le compromis, comme la conversion d'une liste.

Les résultats sur l'échelle logarithmique. L'axe X est la position de l'aiguille (il faut plus de temps pour trouver si c'est plus bas dans le tableau); dernière valeur est une aiguille qui n'est pas dans le tableau. L'axe Y est le temps pour le trouver.

Le tableau avait 1 millions d'éléments et les tests ont été exécutés 100 fois. Des résultats encore fluctuer un peu, mais l'évolution qualitative est clair: Python et f2py arrêter au premier élément de sorte qu'ils des échelles différentes. Python est trop lent si l'aiguille n'est pas dans le premier 1%, alors que f2py est rapide (mais vous devez le compiler).

Pour résumer, f2py est la solution la plus rapide, surtout si l'aiguille apparaît assez tôt.

Il n'est pas intégré dans ce qui est ennuyeux, mais c'est vraiment juste 2 minutes de travail. Ajouter cette dans un fichier appelé search.f90:
```
subroutine find_first(needle, haystack, haystack_length, index)
    implicit none
    integer, intent(in) :: needle
    integer, intent(in) :: haystack_length
    integer, intent(in), dimension(haystack_length) :: haystack
!f2py intent(inplace) haystack
    integer, intent(out) :: index
    integer :: k
    index = -1
    do k = 1, haystack_length
        if (haystack(k)==needle) then
            index = k - 1
            exit
        endif
    enddo
end
```
Si vous êtes à la recherche d'autre chose que de integer, il suffit de changer le type. Ensuite compiler à l'aide de:
```
f2py -c -m search search.f90
```
après quoi vous pouvez le faire (à partir de Python):
```
import search
print(search.find_first.__doc__)
a = search.find_first(your_int_needle, your_int_array)
```
- Pourquoi est - f2py de plus pour 1 élément que 10?
- je dirais que, à ces échelles (10e-6), c'est juste du bruit dans les données, et le réel de chaque élément de la vitesse est tellement rapide qu'elle n'a pas de contribuer de manière significative à l'ensemble du temps à ceux qui n < 100
InformationsquelleAutor Mark
11

Vous pouvez convertir une valeur de type boolean tableau à une chaîne Python à l'aide de array.tostring(), puis en utilisant la méthode find ():
```
(array==item).tostring().find('\x01')
```
Ceci implique la copie de données, bien que, depuis le Python cordes doivent être immuable. Un avantage est que vous pouvez également effectuer une recherche, par exemple, un front montant par trouver \x00\x01
- Ce qui est intéressant, mais à peine plus rapide, si, puisque vous avez encore besoin de traiter toutes les données (voir ma réponse pour une référence).
InformationsquelleAutor Rob Reilink
9

En cas de tri des tableaux np.searchsorted œuvres.
- Si le tableau ne pense pas que cet élément de la matrice de longueur sera retourné.
InformationsquelleAutor bubu
7

Je pense que vous avez frappé un problème où une méthode différente et certains a priori la connaissance de la matrice serait vraiment aider. Le genre de chose où vous avez un X probabilité de trouver votre réponse dans la première Y pour cent des données. Le fractionnement le problème avec l'espoir d'obtenir de la chance alors, faire en python avec une liste imbriquée de compréhension ou de quelque chose.

Écrire une fonction C pour ce faire, la force brute n'est pas trop dur à l'aide de ctypes soit.

Le code C j'ai bidouillé (index.c):
```
long index(long val, long *data, long length){
    long ans, i;
    for(i=0;i<length;i++){
        if (data[i] == val)
            return(i);
    }
    return(-999);
}
```
et le python:
```
# to compile (mac)
# gcc -shared index.c -o index.dylib
import ctypes
lib = ctypes.CDLL('index.dylib')
lib.index.restype = ctypes.c_long
lib.index.argtypes = (ctypes.c_long, ctypes.POINTER(ctypes.c_long), ctypes.c_long)

import numpy as np
np.random.seed(8675309)
a = np.random.random_integers(0, 100, 10000)
print lib.index(57, a.ctypes.data_as(ctypes.POINTER(ctypes.c_long)), len(a))
```
et je reçois 92.

Envelopper le python dans une fonction appropriée et là vous allez.

La version C est beaucoup (~20x plus rapide de cette graine (attention je ne suis pas bon avec timeit)
```
import timeit
t = timeit.Timer('np.where(a==57)[0][0]', 'import numpy as np; np.random.seed(1); a = np.random.random_integers(0, 1000000, 10000000)')
t.timeit(100)/100
# 0.09761879920959472
t2 = timeit.Timer('lib.index(57, a.ctypes.data_as(ctypes.POINTER(ctypes.c_long)), len(a))', 'import numpy as np; np.random.seed(1); a = np.random.random_integers(0, 1000000, 10000000); import ctypes; lib = ctypes.CDLL("index.dylib"); lib.index.restype = ctypes.c_long; lib.index.argtypes = (ctypes.c_long, ctypes.POINTER(ctypes.c_long), ctypes.c_long) ')
t2.timeit(100)/100
# 0.005288000106811523
```
- Si le tableau est double (rappelez-vous python flotteurs sont C double par défaut), alors vous avez à penser un peu plus difficile qu' == n'est pas vraiment sûr ou ce que vous voulez pour les valeurs à virgule flottante. Aussi n'oubliez pas que c'est vraiment une bonne idée lors de l'utilisation de ctypes à taper vos tableaux numpy.
- Merci @Brian Larsen . Je pourrais lui donner un essai. Je pense que c'est une simple demande de fonctionnalité pour la prochaine numpy révision.
InformationsquelleAutor Brian Larsen

@tal déjà présenté une numba fonction pour trouver le premier indice, mais qui ne fonctionne que pour les tableaux 1D. Avec np.ndenumerate vous pouvez également trouver le premier indice dans un arbitarly dimensions tableau:

from numba import njit
import numpy as np

@njit
def index(array, item):
    for idx, val in np.ndenumerate(array):
        if val == item:
            return idx
    return None

Exemple de cas:

>>> arr = np.arange(9).reshape(3,3)
>>> index(arr, 3)
(1, 0)

Timings de montrer qu'il est semblable dans la performance de x solution:

arr = np.arange(100000)
%timeit index(arr, 5)           # 1000000 loops, best of 3: 1.88 µs per loop
%timeit find_first(5, arr)      # 1000000 loops, best of 3: 1.7 µs per loop

%timeit index(arr, 99999)       # 10000 loops, best of 3: 118 µs per loop
%timeit find_first(99999, arr)  # 10000 loops, best of 3: 96 µs per loop

Si vous êtes plus intéressé par la recherche le long d'un axe premier: Transposer array avant de l'introduire dans np.ndenumerate, tels que votre axe de l'intérêt vient en premier.

InformationsquelleAutor MSeifert

2

Autant que je sache seulement np.tout et np.tous les booléens les tableaux sont court-circuitées.

Dans votre cas, numpy doit passer par l'ensemble de la matrice, une fois pour créer la condition booléenne et une deuxième fois pour trouver les indices.

Ma recommandation dans ce cas serait d'utiliser cython. Je pense qu'il devrait être facile à régler un exemple pour ce cas, surtout si vous n'avez pas besoin de beaucoup de flexibilité pour les différents dtypes et de formes.

InformationsquelleAutor Josef
2

J'avais besoin pour mon travail donc je me suis enseigné Python Numpy et de l'interface C et écrit mon propre. http://pastebin.com/GtcXuLyd C'est uniquement pour les tableaux 1d, mais fonctionne pour la plupart des types de données (int, float, ou de chaînes de caractères) et les tests ont montré qu'il est encore environ 20 fois plus rapide que prévu de l'approche en pur Python-numpy.

InformationsquelleAutor dpitch40
2

Si votre liste est triés, vous pouvez obtenir très rapide de recherche de l'index avec le "coupent" paquet.
Il est O(log(n)) au lieu de O(n).
```
bisect.bisect(a, x)
```
trouve x dans le tableau a, certainement plus rapide dans le triées cas que tout C-routine passe en revue tous les éléments premiers (assez longtemps listes).

Il est bon de savoir parfois.
- >>> cond = "import numpy as np;a = np.arange(40)" timeit("np.searchsorted(a, 39)", cond) fonctionne pour 3.47867107391 secondes. timeit("bisect.bisect(a, 39)", cond2) fonctionne pour 7.0661458969116 secondes. Il ressemble à numpy.searchsorted est mieux pour triés les tableaux (au moins pour ints).
InformationsquelleAutor ngrislain
1

Comme une longue matlab utilisateur I ont été à la recherche d'une solution efficace à ce problème depuis un certain temps. Enfin, motivés par des discussions, une proposition dans ce fil j'ai essayé de venir avec une solution qui est de la mise en œuvre d'une API similaire à ce qui a été suggéré ici, l'appui pour l'instant, seuls tableaux 1D.

Que vous pouvez l'utiliser comme ceci
```
import numpy as np
import utils_find_1st as utf1st
array = np.arange(100000)
item = 1000
ind = utf1st.find_1st(array, item, utf1st.cmp_larger_eq)
```
La condition opérateurs pris en charge sont: cmp_equal, cmp_not_equal, cmp_larger, cmp_smaller, cmp_larger_eq, cmp_smaller_eq. Pour l'efficacité de l'extension est écrit en c.

Vous trouver la source, de critères et d'autres détails ici:

https://pypi.python.org/pypi?name=py_find_1st&:action=afficher

pour l'utilisation dans notre équipe (anaconda sur linux et macos) j'ai fait un programme d'installation anaconda qui simplifie l'installation, vous pouvez l'utiliser comme décrit ici

https://anaconda.org/roebel/py_find_1st
- "en tant Que de longue date matlab utilisateur" - qu'est-ce que l'matlab orthographe pour cela?
InformationsquelleAutor A Roebel

Juste une note que si vous faites une séquence de recherches, le gain de performances de faire quelque chose d'intelligent comme la conversion de chaînes de caractères, peut-être perdu dans la boucle externe si la recherche de la dimension n'est pas assez grand. Voir comment la performance de l'itération find1 qui utilise la chaîne de conversion astuce proposée ci-dessus et find2 qui utilise argmax le long de l'intérieur de l'axe (en plus d'un ajustement pour assurer un non-match retourne -1)

import numpy,time
def find1(arr,value):
    return (arr==value).tostring().find('\x01')

def find2(arr,value): #find value over inner most axis, and return array of indices to the match
    b = arr==value
    return b.argmax(axis=-1) - ~(b.any())


for size in [(1,100000000),(10000,10000),(1000000,100),(10000000,10)]:
    print(size)
    values = numpy.random.choice([0,0,0,0,0,0,0,1],size=size)
    v = values>0

    t=time.time()
    numpy.apply_along_axis(find1,-1,v,1)
    print('find1',time.time()-t)

    t=time.time()
    find2(v,1)
    print('find2',time.time()-t)

sorties

(1, 100000000)
('find1', 0.25300002098083496)
('find2', 0.2780001163482666)
(10000, 10000)
('find1', 0.46200013160705566)
('find2', 0.27300000190734863)
(1000000, 100)
('find1', 20.98099994659424)
('find2', 0.3040001392364502)
(10000000, 10)
('find1', 206.7590000629425)
('find2', 0.4830000400543213)

Cela dit, écrit en C serait au moins un peu plus vite que l'autre de ces approches

InformationsquelleAutor dlm

0

comment à ce sujet
```
import numpy as np
np.amin(np.where(array==item))
```
- Alors que ce code peut répondre à la question, en fournissant plus de contexte sur pourquoi et/ou comment il répond à la question permettrait d'améliorer de manière significative sa valeur à long terme. Veuillez modifier votre réponse à ajouter quelques explications.
- Je suis assez sûr que c'est encore plus lente que where(array==item)[0][0] de la question...
InformationsquelleAutor nkvnkv

Ce problème peut être résolu dans le plus pur numpy par le traitement de la matrice en blocs:

def find_first(x):
    idx, step = 0, 32
    while idx < x.size:
        nz, = x[idx: idx + step].nonzero()
        if len(nz): # found non-zero, return it
            return nz[0] + idx
        # move to the next chunk, increase step
        idx += step
        step = min(9600, step + step // 2)
    return -1

Le tableau est transformé en morceau de la taille step. Le step plus l'étape est, le plus rapide est de traitement de remise à zéro-array (pire des cas). La plus petite, il est, au traitement plus rapide de tableau avec des non-zéro au début. Le truc est de commencer avec une petite step et de l'augmenter de façon exponentielle. En outre, il n'est pas nécessaire d'incrémenter au-dessus d'un certain seuil en raison des avantages limités.

J'ai comparé la solution avec de la pure ndarary.différent de zéro et numba solution contre 10 millions de tableau de float.

import numpy as np
from numba import jit
from timeit import timeit
def find_first(x):
idx, step = 0, 32
while idx < x.size:
nz, = x[idx: idx + step].nonzero()
if len(nz):
return nz[0] + idx
idx += step
step = min(9600, step + step // 2)
return -1
@jit(nopython=True)
def find_first_numba(vec):
"""return the index of the first occurence of item in vec"""
for i in range(len(vec)):
if vec[i]:
return i
return -1
SIZE = 10_000_000
# First only
x = np.empty(SIZE)
find_first_numba(x[:10])
print('---- FIRST ----')
x[:] = 0
x[0] = 1
print('ndarray.nonzero', timeit(lambda: x.nonzero()[0][0], number=100)*10, 'ms')
print('find_first', timeit(lambda: find_first(x), number=1000), 'ms')
print('find_first_numba', timeit(lambda: find_first_numba(x), number=1000), 'ms')
print('---- LAST ----')
x[:] = 0
x[-1] = 1
print('ndarray.nonzero', timeit(lambda: x.nonzero()[0][0], number=100)*10, 'ms')
print('find_first', timeit(lambda: find_first(x), number=100)*10, 'ms')
print('find_first_numba', timeit(lambda: find_first_numba(x), number=100)*10, 'ms')
print('---- NONE ----')
x[:] = 0
print('ndarray.nonzero', timeit(lambda: x.nonzero()[0], number=100)*10, 'ms')
print('find_first', timeit(lambda: find_first(x), number=100)*10, 'ms')
print('find_first_numba', timeit(lambda: find_first_numba(x), number=100)*10, 'ms')
print('---- ALL ----')
x[:] = 1
print('ndarray.nonzero', timeit(lambda: x.nonzero()[0][0], number=100)*10, 'ms')
print('find_first', timeit(lambda: find_first(x), number=100)*10, 'ms')
print('find_first_numba', timeit(lambda: find_first_numba(x), number=100)*10, 'ms')

Et les résultats sur ma machine:

---- FIRST ----
ndarray.nonzero 54.733994480002366 ms
find_first 0.0013148509997336078 ms
find_first_numba 0.0002839310000126716 ms
---- LAST ----
ndarray.nonzero 54.56336712999928 ms
find_first 25.38929685000312 ms
find_first_numba 8.022820680002951 ms
---- NONE ----
ndarray.nonzero 24.13432420999925 ms
find_first 25.345200140000088 ms
find_first_numba 8.154927100003988 ms
---- ALL ----
ndarray.nonzero 55.753537260002304 ms
find_first 0.0014760300018679118 ms
find_first_numba 0.0004358099977253005 ms

Pur ndarray.nonzero est certain assouplissement. Le numba solution est environ 5 fois plus rapide pour le meilleur des cas. Il est environ 3 fois plus rapide dans le pire des cas.

InformationsquelleAutor tstanisl

-1

Vous pouvez convertir votre tableau dans un list et à l'utilisation c'est index() méthode:
```
i = list(array).index(item)
```
Autant que je suis au courant, c'est un C compilé méthode.
- cela est susceptible d'être plusieurs fois plus lent que juste de prendre le premier résultat de np.où
- très vrai.. j'ai utilisé timeit() sur un tableau de 10000 entiers -- la conversion d'une liste est environ 100 fois plus lent! J'avais oublié que les données sous-jacentes de la structure d'un tableau numpy est très différent à partir d'une liste..
InformationsquelleAutor drevicko

Vous devez vous connecter pour publier un commentaire.