indices des k plus grands éléments dans un des ménagères de longueur n de la matrice de

J'ai besoin de trouver les indices des k plus grands éléments d'un non triés, de longueur n, la matrice/vecteur en C++, avec k < n. J'ai vu comment utiliser nth_element() pour trouver le k-ième statistique, mais je ne suis pas sûr si ce est le bon choix pour mon problème comme il semble que j'aurais besoin de faire des appels k à nth_statistic, je pense qu'il aurait complexité O(kn), ce qui peut être aussi bon qu'il peut l'obtenir? Ou est-il un moyen de le faire juste en O(n)?

De la mettre en œuvre sans nth_element() semble que je vais avoir à parcourir l'ensemble du tableau une fois, le remplissage d'une liste d'indices de plus grands éléments à chaque étape.

Est-il quelque chose dans la bibliothèque C++ standard qui en fait un one-liner ou de toute manière intelligente de mettre en œuvre moi-même en quelques lignes? Dans mon cas particulier, k = 3 et n = 6, donc l'efficacité n'est pas une préoccupation majeure, mais il serait bien de trouver un endroit propre et efficace pour ce faire, pour arbitraire k et n.

Il ressemble Marque les N premiers éléments d'un tableau non trié est probablement le plus proche de poster je peux trouver, les affichages, il existe en Python et PHP.

Pouvez-vous modifier le vecteur? nth_element va faire un partiel de tri en place, de sorte qu'il modifie le vecteur.
Le vecteur peut être modifié, mais le résultat final doit être les indices du vecteur d'origine) des k plus grands éléments.
C'est juste un algorithme de sélection. Généralement, vous utiliserez soit tas de sélectionner ou de sélection rapide. Voir stackoverflow.com/q/7746648/56778 pour une question similaire. Il y a une réponse avec une bonne C++ solution. (à l'aide de priority_queue)
Par ailleurs, si k=3 et n=6, alors vous êtes probablement mieux de juste trier le tableau et choisir le top 3 des articles. Comme vous le dites, l'efficacité n'est pas une préoccupation majeure, et la différence entre O(kn) et O(n) est négligeable avec ces petits nombres.

OriginalL'auteur hazelnusse | 2013-02-15

arrays c++indices max

8

Voici mon application qui fait ce que je veux et je pense que raisonnablement efficace:
```
#include <queue>
#include <vector>
//maxindices.cc
//compile with:
//g++ -std=c++11 maxindices.cc -o maxindices
int main()
{
  std::vector<double> test = {0.2, 1.0, 0.01, 3.0, 0.002, -1.0, -20};
  std::priority_queue<std::pair<double, int>> q;
  for (int i = 0; i < test.size(); ++i) {
    q.push(std::pair<double, int>(test[i], i));
  }
  int k = 3; //number of indices we need
  for (int i = 0; i < k; ++i) {
    int ki = q.top().second;
    std::cout << "index[" << i << "] = " << ki << std::endl;
    q.pop();
  }
}
```
qui donne de sortie:
```
index[0] = 3
index[1] = 1
index[2] = 0
```
J'ai programmé une mise en œuvre à l'aide de nth_element et une avec partial_sort et en utilisant une mesure de comparaison... votre mise en œuvre est plus rapide.
Il n'y a pas besoin d'ajouter tous les éléments de la file d'attente de priorité. Que fait l'algorithme O(n log n). Il peut être fait en O(n log k) si vous n'avez pas à ajouter des choses qui sont plus petit que le plus petit élément est déjà dans la file d'attente. Voir stackoverflow.com/q/7746648/56778 pour la discussion.
Je suis peut-être raté quelque chose, mais aussi loin que je peux voir, si j'ai seulement ajouter des éléments qui sont plus grand que le plus petit élément dans la file d'attente je peut finir par manquer de certains de la k-dessus des éléments. E. g si le premier élément que j'ai ajouter dans la file d'attente de priorité est l'élément maximum, il est en même temps le plus petit élément dans la file d'attente et aurait pour conséquence que l'algorithme ne pas ajouter des éléments.
Si vous regardez liée à répondre, vous verrez que vous avez initialement remplir la file d'attente de priorité avec la première k éléments. , vous pouvez utiliser le seul-ajouter-si-plus grand que le plus petit de la règle sur les éléments restants.
Qu'en est-il quand il y a une cravate(s) avec k-ième plus grand élément? Serait agréable d'avoir cette extension à votre méthode.

OriginalL'auteur hazelnusse
6

La question a la réponse partielle; c'est-à std::nth_element renvoie la "le n-ième statistique" avec une propriété que aucun des éléments précédents nième sont plus que, et aucun des éléments suivants sont moins.

Par conséquent, juste un appel à std::nth_element est suffisant pour obtenir les k plus grands éléments. Complexité temporelle O(n), qui est théoriquement la plus faible depuis que vous avez à visiter chaque élément au moins une fois pour trouver le plus petit (ou dans ce cas k le plus petit) élément(s). Si vous avez besoin de ces éléments k à être commandés, alors vous avez besoin de commander qui sera O(k log(k)). Alors, au total O(n + k log(k)).

Ce trouve les k plus grands éléments, alors que l'OP exigence est de trouver les k plus grands indices.
Eh bien, vous avez raison, et (en regardant de nouveau la question) je ne sais pas pourquoi j'ai donné cette réponse, en premier lieu, et pourquoi les gens en haut-voté. Mais plus que probablement, ils ont mal compris la question, tout comme moi, et apparemment, cette réponse a aidé d'une certaine façon, donc je vais le garder comme ça.

OriginalL'auteur Halil ŞEN

Cela devrait être une version améliorée de @hazelnusse qui est exécuté dans le O(nlogk) au lieu de O(nlogn)

#include <queue>
#include <iostream>
#include <vector>
//maxindices.cc
//compile with:
//g++ -std=c++11 maxindices.cc -o maxindices
int main()
{
std::vector<double> test = {2, 8, 7, 5, 9, 3, 6, 1, 10, 4};
std::priority_queue< std::pair<double, int>, std::vector< std::pair<double, int> >, std::greater <std::pair<double, int> > > q;
int k = 5; //number of indices we need
for (int i = 0; i < test.size(); ++i) {
if(q.size()<k)
q.push(std::pair<double, int>(test[i], i));
else if(q.top().first < test[i]){
q.pop();
q.push(std::pair<double, int>(test[i], i));
}
}
k = q.size();
std::vector<int> res(k);
for (int i = 0; i < k; ++i) {
res[k - i - 1] = q.top().second;
q.pop();
}
for (int i = 0; i < k; ++i) {
std::cout<< res[i] <<std::endl;
}
}

8
4
1
2
6

OriginalL'auteur justHelloWorld

Vous pouvez utiliser la base de l'algorithme quicksort de faire ce que vous avez besoin, sauf qu'au lieu de la réorganisation des partitions, vous pouvez vous débarrasser des entrées de tomber de votre gamme désirée.

Il a été appelé "sélection rapide" et voici une implémentation C++ :

int partition(int* input, int p, int r)
{
int pivot = input[r];
while ( p < r )
{
while ( input[p] < pivot )
p++;
while ( input[r] > pivot )
r--;
if ( input[p] == input[r] )
p++;
else if ( p < r ) {
int tmp = input[p];
input[p] = input[r];
input[r] = tmp;
}
}
return r;
}
int quick_select(int* input, int p, int r, int k)
{
if ( p == r ) return input[p];
int j = partition(input, p, r);
int length = j - p + 1;
if ( length == k ) return input[j];
else if ( k < length ) return quick_select(input, p, j - 1, k);
else  return quick_select(input, j + 1, r, k - length);
}
int main()
{
int A1[] = { 100, 400, 300, 500, 200 };
cout << "1st order element " << quick_select(A1, 0, 4, 1) << endl;
int A2[] = { 100, 400, 300, 500, 200 };
cout << "2nd order element " << quick_select(A2, 0, 4, 2) << endl;
int A3[] = { 100, 400, 300, 500, 200 };
cout << "3rd order element " << quick_select(A3, 0, 4, 3) << endl;
int A4[] = { 100, 400, 300, 500, 200 };
cout << "4th order element " << quick_select(A4, 0, 4, 4) << endl;
int A5[] = { 100, 400, 300, 500, 200 };
cout << "5th order element " << quick_select(A5, 0, 4, 5) << endl;
}

De SORTIE:

1st order element 100
2nd order element 200
3rd order element 300
4th order element 400
5th order element 500

MODIFIER

Cette mise en œuvre a un O(n) temps d'exécution moyen; en raison de la méthode de sélection de pivot, il partage quicksort du pire cas de l'exécution. Par l'optimisation du choix de pivot, votre pire des cas aussi devient O(n).

OriginalL'auteur Mahmoud Al-Qudsi

De la bibliothèque standard de ne pas obtenir de vous une liste d'indices (il a été conçu pour éviter de passer des données redondantes). Toutefois, si vous êtes intéressé dans les n plus grands éléments, utilisez un certain type de partitionnement (les deux std::partition et std::nth_element O(n)):

#include <iostream>
#include <algorithm>
#include <vector>
struct Pred {
Pred(int nth) : nth(nth) {};
bool operator()(int k) { return k >= nth; }
int nth;
};
int main() {
int n = 4;
std::vector<int> v = {5, 12, 27, 9, 4, 7, 2, 1, 8, 13, 1};
//Moves the nth element to the nth from the end position.
std::nth_element(v.begin(), v.end() - n, v.end());
//Reorders the range, so that the first n elements would be >= nth.
std::partition(v.begin(), v.end(), Pred(*(v.end() - n)));
for (auto it = v.begin(); it != v.end(); ++it)
std::cout << *it << " ";
std::cout << "\n";
return 0;
}

J'ai précisément besoin d'indices.
Vous pouvez définir un type de structure de vos éléments, de les stocker à la fois de la valeur et de l'indice d'origine, et en attendant de définir le comparateur.

OriginalL'auteur Richard Pump

0

Vous pouvez le faire dans O(n) temps avec un seul ordre statistique de calcul:
- Laisser r être le k-ième ordre statistique
- Initialiser deux vide listes bigger et equal.
- Pour chaque indice i:
  - Si array[i] > r, ajouter i à bigger
  - Si array[i] = r, ajouter i à equal
- Écarter les éléments de equal jusqu'à ce que la somme des longueurs des deux listes est k
- Retour de la concaténation de deux listes.
Naturellement, vous avez seulement besoin d'une liste si tous les éléments sont distincts. Et si nécessaire, vous pourriez faire des tours de combiner les deux listes en une seule, bien que ce serait rendre le code plus compliqué.

OriginalL'auteur Hurkyl

Même si le code suivant ne peuvent pas remplir le désiré de la complexité des contraintes, il pourrait être une alternative intéressante pour ladite file d'attente de priorité.

#include <queue>
#include <vector>
#include <iostream>
#include <iterator>
#include <algorithm>
std::vector<int> largestIndices(const std::vector<double>& values, int k) {
std::vector<int> ret;
std::vector<std::pair<double, int>> q;
int index = -1;
std::transform(values.begin(), values.end(), std::back_inserter(q), [&](double val) {return std::make_pair(val, ++index); });
auto functor = [](const std::pair<double, int>& a, const std::pair<double, int>& b) { return b.first > a.first; };
std::make_heap(q.begin(), q.end(), functor);
for (auto i = 0; i < k && i<values.size(); i++) {
std::pop_heap(q.begin(), q.end(), functor);
ret.push_back(q.back().second);
q.pop_back();
}
return ret;
}
int main()
{
std::vector<double> values = { 7,6,3,4,5,2,1,0 };
auto ret=largestIndices(values, 4);
std::copy(ret.begin(), ret.end(), std::ostream_iterator<int>(std::cout, "\n"));
}

OriginalL'auteur Aleph0

Vous devez vous connecter pour publier un commentaire.