C structure de données pour imiter de C#List<List<int>>?

Je suis à la recherche de refactoriser une méthode c# dans une fonction c dans une tentative de gagner un peu de vitesse, et ensuite appeler la dll c en c# pour permettre à mon programme pour utiliser la fonctionnalité.

Actuellement la méthode c# prend une liste d'entiers et qui renvoie une liste de listes de nombres entiers. La méthode calculé la puissance des entiers donc, une entrée de 3 ints d'obtenir le résultat suivant (à ce stade, les valeurs de l'ints est pas importante car elle est utilisée en interne d'une valeur de pondération)

1
2
3
1,2
1,3
2,3
1,2,3

Où chaque ligne représente une liste d'entiers. La sortie indique l'index (avec un décalage de 1) de la première liste, non pas la valeur. Donc 1,2 indique que l'élément à l'indice 0 et 1 sont un élément de la puissance.

Je suis pas familier avec le c, donc ce sont mes meilleures options pour les structures de données qui va permettre à la c# pour accéder aux données renvoyées?

Merci d'avance

Mise à jour

Merci à tous pour vos commentaires jusqu'à présent. Ici, c'est un peu un arrière-plan à la nature du problème.

La méthode itérative pour le calcul de la puissance d'un ensemble est assez simple. Deux boucles et un peu de manipulation de bits est tout là est à lui vraiment. Il a juste appelé..beaucoup (en fait des milliards de fois, si la taille de l'ensemble est assez grand).

Thoughs autour de l'aide de c (c++ comme les gens l'ont souligné) sont qu'il donne plus de portée pour l'optimisation des performances. Un port direct ne peuvent pas offrir toute augmentation, mais elle ouvre la voie pour plus porté sur les méthodes pour obtenir un peu plus de vitesse hors de lui. Même une petite augmentation par itération équivaudrait à une augmentation mesurable.

Mon idée était de port direct version et ensuite travailler pour l'augmenter. Et puis à refactoriser au fil du temps (avec l'aide de tout le monde ici, DONC).

Mise à jour 2

Juste un autre point de jalf.com, je n'ai pas à utiliser la liste ou equivelent. Si il ya une meilleure façon, alors je suis ouvert aux suggestions. La seule raison pour laquelle la liste a été que chaque ensemble de résultats n'est pas de la même taille.

Le code pour l'instant...

public List<List<int>> powerset(List<int> currentGroupList)
{
    _currentGroupList = currentGroupList;
    int max;
    int count;

    //Count the objects in the group
    count = _currentGroupList.Count;
    max = (int)Math.Pow(2, count);

    //outer loop
    for (int i = 0; i < max; i++)
    {
        _currentSet = new List<int>();

        //inner loop
        for (int j = 0; j < count; j++)
        {              
            if ((i & (1 << j)) == 0)
            {
                _currentSetList.Add(_currentGroupList.ElementAt(j));                          
            }
        }
        outputList.Add(_currentSetList);
    }   
    return outputList;
}

Comme vous pouvez le voir, pas beaucoup à elle. Il va rond et rond beaucoup!

J'accepte que la création et la construction de listes peut ne pas être le moyen le plus efficace, mais j'ai besoin d'un moyen de fournir les résultats dans une manière gérable.

Mise à jour 2

Merci pour tous les commentaires et la mise en œuvre des travaux. Juste pour clarifier quelques points soulevés: je n'ai pas besoin de la sortie pour être en "ordre naturel", et aussi je ne suis pas intéressé par l'ensemble vide est retournée.

hughdbrown de la mise en œuvre est intesting mais je pense que j'ai besoin de stocker les résultats (ou au moins une partie d'entre eux) à un certain point. Cela ressemble à de la mémoire limitiations appliquera à long avant d'exécuter le temps devient un réel problème.
En partie à cause de cela, je pense que je peux m'en sortir avec l'aide octets au lieu de nombres entiers, de donner plus de potentiel de stockage.

La véritable question est donc la suivante: Avons-nous atteint la vitesse maximale pour cette calcualtion en C#? L'option de code non managé fournir plus de portée. Je sais que dans de nombreux égards, la réponse est futile, car même si nous havled le temps de courir, il ne ferait que permettre un supplément de valeurs dans le jeu original.

int** une liste à une liste de int.
non, il a juste des points à un pointeur vers un int. Le montant de la simplification conduira à de nombreuses heures de débogage de la douleur pour nos chers jxh00u
Cela dépend vraiment de ce que vous faites avec elle 🙂
L'interopérabilité va tuer tous les gains de performance. Afficher votre C# et demander un meilleur algorithme, ou peu sûres de manipulation du pointeur conseils.
Wouldnt l'interopérabilité ralentir seulement se produire que lorsque l'appel a été fait?
Il sera toujours plus facile, plus sûre et plus facile à maintenir si vous optimisé le C#.
Re: à l'aide d'octets au lieu de nombres entiers, de donner plus de potentiel de stockage des Entiers de quatre fois la taille d'octets. Cela signifie que vous pourriez gérer un powerset avec plus de deux éléments. Est-ce vraiment utile? À l'aide de taux de retour pour ne conserver qu'un seul set en mémoire donne un véritable coup de fouet.
Re: je pense que j'ai besoin de stocker les résultats (ou au moins une partie d'entre eux), Vous allez déterminer au moment de l'exécution que certains sous-ensemble est intéressant/utile? Pouvez-vous nous dire quel type d'application que vous construisez? Et combien d'éléments dont vous avez besoin pour powerset à la fois?
Je suppose que je suis en train d'essayer de trouver la limite théorique de choses que je pourrais powerset. L'application powerset certains objecs qui peuvent être regroupés pour fournir une sauvegarde (c'est à dire faire deux choses en même temps est mieux que de faire les deux choses independtntly). Je sais que c'est une implémentation naïve...
suite...et devinez ce qu'une certaine dynamique ou heuristical méthode pourrait se rapprocher pour moins d'effort. Les valeurs dans l'entrée sera un "coût". En additionnant les valeurs de chaque powerset de retour (ou de conserver un total en cours d'exécution dans la boucle) permettra de déterminer si l'ensemble est "valable". Je suis d'accord que le rendement de retour est utile.

InformationsquelleAutor jheppinstall | 2008-12-05

c c#data-structures refactoring

5

Ce retourne un ensemble de powerset à la fois. Il est basé sur le code python ici. Il travaille pour powersets de plus de 32 éléments. Si vous avez besoin de moins de 32, vous pouvez modifier long int. Il est assez vite, plus vite que mon algorithme précédent et plus rapide que (mon modifiés pour utiliser les taux de retour en version) P Daddy code.
```
static class PowerSet4<T>
{
    static public IEnumerable<IList<T>> powerset(T[] currentGroupList)
    {
        int count = currentGroupList.Length;
        Dictionary<long, T> powerToIndex = new Dictionary<long, T>();
        long mask = 1L;
        for (int i = 0; i < count; i++)
        {
            powerToIndex[mask] = currentGroupList[i];
            mask <<= 1;
        }

        Dictionary<long, T> result = new Dictionary<long, T>();
        yield return result.Values.ToArray();

        long max = 1L << count;
        for (long i = 1L; i < max; i++)
        {
            long key = i & -i;
            if (result.ContainsKey(key))
                result.Remove(key);
            else
                result[key] = powerToIndex[key];
            yield return result.Values.ToArray();
        }
    }
}
```
Vous pouvez télécharger toutes les versions plus rapide, j'ai testé ici.

Je pense vraiment que l'utilisation de taux de retour est le changement qui rend le calcul de grand powersets possible. L'allocation de grandes quantités de mémoire initial d'exécution augmente de façon spectaculaire et les causes des algorithmes à l'échec par manque de mémoire très tôt. Affiche originale devriez comprendre comment de nombreux ensembles d'un ensemble des parties qu'il faut à la fois. Détenant la totalité d'entre eux n'est pas vraiment une option >24 éléments.
- Je pense que vous avez raison que c'est le rendement qui fait la différence. Je suis très impressionné par votre ténacité pour fournir le plus rapide possible de la mise en œuvre, ainsi que plusieurs points très valables faite. Une mention honorable à P Papa aussi, et à tous ceux qui ont apporté leur contribution.
- P Papa avait une idée cool que je n'ai pas appelé encore -- la répartition de taille fixe de tableaux qui sont de la bonne longueur. En revanche, le redimensionnement des Listes est cher. Mon code fait des Listes de longueur maximale afin de ne pas réaffecter.
- Si je faisais ce que j'avais à écrire une coutume IList<T> class qui s'enroule autour d'un tableau dont la taille est fixée à currentGroupList.Longueur. Vous pouvez facilement obtenir de meilleures performances que le dictionnaire de mise en œuvre ici.
InformationsquelleAutor hughdbrown
10

Aussi, assurez-vous que le passage à la C/C++ est vraiment ce que vous devez faire pour la vitesse, pour commencer. Instrument de l'original de la méthode C# (autonome, exécutée par le biais de tests unitaires), instrument de la nouvelle C/C++ méthode (encore une fois, autonome via des tests unitaires) et de voir ce que le monde réel différence.

La raison pour laquelle je aborder cette question, c'est que je crains qu'il ne peut être un pyrhhic victoire -- à l'aide de Smokey Bacon conseils, vous obtenez votre liste de classe, vous êtes dans le "plus rapide" C++, mais il y a toujours un coût pour l'appelant que la DLL: Rebondir hors de la durée de P/Invoke ou COM interop porte une somme assez importante sur les performances.

Être sûr que vous êtes l'obtention de votre "argent" de ce saut avant de le faire.

Mise à jour basé sur l'OP de la mise à Jour

Si vous êtes à l'appel de cette boucle, vous devez absolument vous assurer que la totalité de la boucle logique est encapsulé dans un seul appel d'interopérabilité -- dans le cas contraire les frais généraux de triage (comme d'autres ici l'ont mentionné) va certainement vous tuer.

Je pense que, compte tenu de la description du problème, que le problème n'est pas que C#/.NET est "plus lent" que C, mais il est plus probable que le code doit être optimisé. Comme une autre affiche ici mentionnés, vous pouvez utiliser les pointeurs en C# sérieusement d'augmenter les performances dans ce genre de boucle, sans la nécessité pour la sérialisation. Je regarde pour la première, avant de sauter dans un complexe interop monde, pour ce scénario.

InformationsquelleAutor John Rudy

Si vous êtes à la recherche d'utiliser le C pour un gain de performance, le plus probable que vous envisagez de le faire par le biais de l'utilisation de pointeurs. C# ne permet l'utilisation des pointeurs, en utilisant le mot-clé unsafe. Avez-vous pensé à cela?

Également comment allez-vous appeler ce code.. qu'il sera appelé souvent (par exemple, dans une boucle?) Si oui, le fait d'insérer les données avant et arrière peuvent plus que compenser les gains de performance.

Suivi

Prendre un coup d'oeil à Code natif sans sacrifier .Performance NETTE pour certains interop options. Il existe des moyens pour l'interopérabilité sans trop de perte de performance, mais ceux interops ne peut se faire avec le plus simple des types de données.

Si j'ai toujours pense que vous devriez enquêter sur la vitesse de votre code à l'aide de droites .NET.

Suivi 2

Aussi, je suggère que si vous avez votre coeur sur un mélange de code natif et du code managé, que vous créez votre bibliothèque à l'aide de c++/cli. Ci-dessous est un exemple simple. Notez que je ne suis pas un c++/cli gars, et ce code ne fait rien d'utile...ses juste pour but de montrer comment vous pouvez facilement mélanger de code natif et géré.

#include "stdafx.h"
using namespace System;
System::Collections::Generic::List<int> ^MyAlgorithm(System::Collections::Generic::List<int> ^sourceList);
int main(array<System::String ^> ^args)
{
System::Collections::Generic::List<int> ^intList = gcnew System::Collections::Generic::List<int>();
intList->Add(1);
intList->Add(2);
intList->Add(3);
intList->Add(4);
intList->Add(5);
Console::WriteLine("Before Call");
for each(int i in intList)
{
Console::WriteLine(i);
}
System::Collections::Generic::List<int> ^modifiedList = MyAlgorithm(intList);
Console::WriteLine("After Call");
for each(int i in modifiedList)
{
Console::WriteLine(i);
}
}
System::Collections::Generic::List<int> ^MyAlgorithm(System::Collections::Generic::List<int> ^sourceList)
{
int* nativeInts = new int[sourceList->Count];
int nativeIntArraySize = sourceList->Count;
//Managed to Native
for(int i=0; i<sourceList->Count; i++)
{
nativeInts[i] = sourceList[i];
}
//Do Something to native ints
for(int i=0; i<nativeIntArraySize; i++)
{
nativeInts[i]++;
}
//Native to Managed
System::Collections::Generic::List<int> ^returnList = gcnew System::Collections::Generic::List<int>();
for(int i=0; i<nativeIntArraySize; i++)
{
returnList->Add(nativeInts[i]);
}
return returnList;
}

InformationsquelleAutor Giovanni Galbo

7

Ce qui vous fait penser que vous allez gagner de la vitesse en appelant le code C? C n'est pas comme par magie plus rapide que le C#. Il peut être, bien sûr, mais il peut aussi facilement être plus lent (et buggier). Surtout quand vous facteur dans le p/invoke appels en code natif, il est loin d'être certain que cette approche permettra d'accélérer quoi que ce soit.

En tout cas, C de ne pas avoir quelque chose comme la Liste. Il a cru les tableaux et les pointeurs (et on pourrait dire que int** est plus ou moins l'équivalent), mais vous êtes probablement mieux d'utiliser C++, qui n'ont d'équivalent structures de données. En particulier, std::vector.
Il n'y a pas de moyens simples pour exposer ces données, C#, cependant, car il sera dispersé assez bien au hasard (chaque liste est un pointeur vers certains de mémoire allouée dynamiquement quelque part)

Je soupçonne cependant, la plus grande amélioration de la performance provient de l'amélioration de l'algorithme en C#.

Edit:

Je peux voir plusieurs choses dans votre algorithme qui semblent fonctionner de manière optimale. La construction d'une liste de listes n'est pas gratuit. Peut-être vous pouvez créer une liste unique et l'utilisation des positions différentes pour représenter chaque sous-liste. Ou peut-être à l'aide du rendement de retour " et IEnumerable au lieu de construire explicitement des listes pourrait être plus rapide.

Avez-vous profilé votre code, où le temps est dépensé?

InformationsquelleAutor jalf
5

Je vais aussi mettre un vote pour le réglage de votre C#, en particulier en allant de code "potentiellement dangereux" et de perdre ce qui pourrait être beaucoup de vérification de limites de surcharge.

Même si c'est "dangereux", il n'est pas moins " sûr " que le C/C++, et c'est beaucoup plus facile pour obtenir le droit.

InformationsquelleAutor Will Dean

Ci-dessous est un C# algorithme qui devrait être beaucoup plus rapide (et d'utiliser moins de mémoire) que l'algorithme que vous avez posté. Il n'utilise pas le soigné binaire astuce vôtre utilise, et comme un résultat, le code est un bon peu plus longtemps. Il a un peu plus de for boucles que la vôtre, et qui peut prendre une heure ou deux de marcher à travers elle avec le débogueur entièrement grok il. Mais c'est en fait une approche la plus simple, une fois que vous comprenez ce qu'il fait.

Comme un bonus, les jeux sont plus "naturelles" de l'ordre. Il serait de retour des sous-ensembles de l'ensemble {1 2 3} dans le même ordre que vous avez indiquée dans votre question. Ce n'était pas un accent, mais est un effet secondaire de l'algorithme utilisé.

Dans mes tests, j'ai trouvé cet algorithme soit environ 4 fois plus rapide que l'algorithme que vous avez posté pour un grand jeu de 22 articles (qui était aussi grand que je pouvais aller sur ma machine sans trop de disque-volée de biaiser les résultats trop). Un run de la vôtre a pris environ 15,5 secondes, et le mien a pris environ 3,6 secondes.

Pour les petites listes, la différence est moins prononcée. Pour un ensemble de seulement 10 points, le vôtre a couru 10 000 fois environ 7,8 secondes, et le mien a pris environ 3,2 secondes. Pour les ensembles avec 5 ou moins d'éléments, ils ont a peu près le même temps. Avec un nombre d'itérations, la vôtre tourne un peu plus vite.

De toute façon, voici le code. Désolé, c'est tellement long, j'ai essayé de m'assurer que je commente, c'est bien.

/* 
* Made it static, because it shouldn't really use or modify state data.
* Making it static also saves a tiny bit of call time, because it doesn't
* have to receive an extra "this" pointer.  Also, accessing a local
* parameter is a tiny bit faster than accessing a class member, because
* dereferencing the "this" pointer is not free.
* 
* Made it generic so that the same code can handle sets of any type.
*/
static IList<IList<T>> PowerSet<T>(IList<T> set){
if(set == null)
throw new ArgumentNullException("set");
/*
* Caveat:
* If set.Count > 30, this function pukes all over itself without so
* much as wiping up afterwards.  Even for 30 elements, though, the
* result set is about 68 GB (if "set" is comprised of ints).  24 or
* 25 elements is a practical limit for current hardware.
*/
int   setSize     = set.Count;
int   subsetCount = 1 << setSize; //MUCH faster than (int)Math.Pow(2, setSize)
T[][] rtn         = new T[subsetCount][];
/* 
* We don't really need dynamic list allocation.  We can calculate
* in advance the number of subsets ("subsetCount" above), and
* the size of each subset (0 through setSize).  The performance
* of List<> is pretty horrible when the initial size is not
* guessed well.
*/
int subsetIndex = 0;
for(int subsetSize = 0; subsetSize <= setSize; subsetSize++){
/*
* The "indices" array below is part of how we implement the
* "natural" ordering of the subsets.  For a subset of size 3,
* for example, we initialize the indices array with {0, 1, 2};
* Later, we'll increment each index until we reach setSize,
* then carry over to the next index.  So, assuming a set size
* of 5, the second iteration will have indices {0, 1, 3}, the
* third will have {0, 1, 4}, and the fifth will involve a carry,
* so we'll have {0, 2, 3}.
*/
int[] indices = new int[subsetSize];
for(int i = 1; i < subsetSize; i++)
indices[i] = i;
/*
* Now we'll iterate over all the subsets we need to make for the
* current subset size.  The number of subsets of a given size
* is easily determined with combination (nCr).  In other words,
* if I have 5 items in my set and I want all subsets of size 3,
* I need 5-pick-3, or 5C3 = 5! /3!(5 - 3)! = 10.
*/
for(int i = Combination(setSize, subsetSize); i > 0; i--){
/*
* Copy the items from the input set according to the
* indices we've already set up.  Alternatively, if you
* just wanted the indices in your output, you could
* just dup the index array here (but make sure you dup!
* Otherwise the setup step at the bottom of this for
* loop will mess up your output list!  You'll also want
* to change the function's return type to
* IList<IList<int>> in that case.
*/
T[] subset = new T[subsetSize];
for(int j = 0; j < subsetSize; j++)
subset[j] = set[indices[j]];
/* Add the subset to the return */
rtn[subsetIndex++] = subset;
/*
* Set up indices for next subset.  This looks a lot
* messier than it is.  It simply increments the
* right-most index until it overflows, then carries
* over left as far as it needs to.  I've made the
* logic as fast as I could, which is why it's hairy-
* looking.  Note that the inner for loop won't
* actually run as long as a carry isn't required,
* and will run at most once in any case.  The outer
* loop will go through as few iterations as required.
* 
* You may notice that this logic doesn't check the
* end case (when the left-most digit overflows).  It
* doesn't need to, since the loop up above won't
* execute again in that case, anyway.  There's no
* reason to waste time checking that here.
*/
for(int j = subsetSize - 1; j >= 0; j--)
if(++indices[j] <= setSize - subsetSize + j){
for(int k = j + 1; k < subsetSize; k++)
indices[k] = indices[k - 1] + 1;
break;
}
}
}
return rtn;
}
static int Combination(int n, int r){
if(r == 0 || r == n)
return 1;
/*
* The formula for combination is:
*
*       n!
*   ----------
*   r!(n - r)!
*
* We'll actually use a slightly modified version here.  The above
* formula forces us to calculate (n - r)! twice.  Instead, we only
* multiply for the numerator the factors of n! that aren't canceled
* out by (n - r)! in the denominator.
*/
/*
* nCr == nC(n - r)
* We can use this fact to reduce the number of multiplications we
* perform, as well as the incidence of overflow, where r > n /2
*/
if(r > n / 2) /* We DO want integer truncation here (7 /2 = 3) */
r = n - r;
/*
* I originally used all integer math below, with some complicated
* logic and another function to handle cases where the intermediate
* results overflowed a 32-bit int.  It was pretty ugly.  In later
* testing, I found that the more generalized double-precision
* floating-point approach was actually *faster*, so there was no
* need for the ugly code.  But if you want to see a giant WTF, look
* at the edit history for this post!
*/
double denominator = Factorial(r);
double numerator   = n;
while(--r > 0)
numerator *= --n;
return (int)(numerator / denominator + 0.1/* Deal with rounding errors. */);
}
/*
* The archetypical factorial implementation is recursive, and is perhaps
* the most often used demonstration of recursion in text books and other
* materials.  It's unfortunate, however, that few texts point out that
* it's nearly as simple to write an iterative factorial function that
* will perform better (although tail-end recursion, if implemented by
* the compiler, will help to close the gap).
*/
static double Factorial(int x){
/*
* An all-purpose factorial function would handle negative numbers
* correctly - the result should be Sign(x) * Factorial(Abs(x)) -
* but since we don't need that functionality, we're better off
* saving the few extra clock cycles it would take.
*/
/*
* I originally used all integer math below, but found that the
* double-precision floating-point version is not only more
* general, but also *faster*!
*/
if(x < 2)
return 1;
double rtn = x;
while(--x > 1)
rtn *= x;
return rtn;
}

Ok, donc c'est un assez bon code. Voici ce que je ne comprends pas: lorsque vous augmentez la taille du problème à partir de n à n+1, la quantité de données devrait doubler, et le temps d'exécution devrait doubler, trop. Ce n'est pas ce que je vois: 18 prend 0.16 sec et 24 prend 0.97 sec. 64x les données dure 6 fois plus longtemps.
Les données plus du double. Le nombre de sous-ensembles doubles, et le nombre total de membres de ces ensembles augmente de (n + 1) * 2 / n, ce qui signifie qu'il quadruple n va de 1 à 2, triples n va de 2 à 3, et s'approche d'un facteur de deux, que n tend vers l'infini. (suite...)
De la merde! J'ai trouvé un bug... comme dirait ma numérateur en Combinaison est débordante. Je vais mettre à jour en temps.
Bon, le bug. Maintenant, je reçois environ une 80x différence de vitesse entre le 16 et le 22 (24 sur ma machine est trop élevé), ce qui est environ la même que la différence dans la taille des données. Bonne prise, par la manière.
Euh, P Papa, votre code continue à être mauvais. Vous n'avez pas testé votre Factorielle() fonction depuis le modifier. Voici les résultats de 10! pour 13!: 10: 3628800 11: 39916800 12: 479001600 13: 1932053504 Notez que 13! doit avoir au moins autant de 0 que de 12!.
Tentez votre code actuel sur l'ensemble de la taille 26. Il explose parce que 26C13 est incorrect.
Utilisez cette, éliminer Factorielle(): static long de la Combinaison(long n, long r) { r = (r > n - r) ? (n - r) : r; if (r == 0) return 1; long resultat = 1; long k = 1; while (r-- > 0) { resultat *= n--; result /= k++; } return result; }
??? Factorielle(13) retourne 6227020800. Combinaison(26, 13) retourne 10400600. Les deux sont des valeurs correctes. Ce code vous tester?
J'ai retenté votre flotteur en fonction Factorielle code. Il génère les résultats que vous avez dit. Je n'ai aucune idée de comment j'ai été d'obtenir les résultats que j'ai cité plus haut. Encore, la fonction de Combinaison j'ai offert est plus rapide. S'il vous plaît regardez: iwebthereforeiam.com/files/TestYieldReturn.zip le Vôtre est Powerset3.cs.
Votre dernier code est rapide et élégant. Vous devriez poster une nouvelle réponse. Je tiens à souligner un certain nombre de choses, cependant. (1) Vous avez changé ma mise en œuvre dans vos tests. Votre PowerSet3 est plus lent que mon code ci-dessus. Mon origine est encore plus lent que votre PowerSet4, mais tout juste. (suite...)
... (2) la mise en œuvre semble plus en mesure de bénéficier de la non-allocation de la mémoire pour l'ensemble de la puissance. J'ai changé le vôtre pour revenir IList<IList<T>>, et il a couru beaucoup plus lents. Je n'ai pas compris exactement pourquoi, encore. (À noter qu'il est toujours beaucoup plus rapide que l'OP du code). (suite...)
... (3) De votre sortie, ne sont pas seulement les jeux qui ne sont pas "naturelles" de l'ordre, mais l'ordre des éléments à l'intérieur de chaque ensemble est imprévisible (c'est à dire, l'ensemble des éléments ne sont pas triés). Je ne suis pas sûr si cela est important pour l'OP ou pas. (Un vrai jeu n'a pas d'ordre, alors peut-être pas.) (suite...)
Je le répète, que votre algorithme est vraiment chouette, et tu devrais le poster. Votre idée d'utiliser le taux de retour est vraiment bon et vous permettra d'économiser beaucoup de temps et de la mémoire si la coopérative doit visiter chaque sous-ensemble qu'une seule fois. Ma mise en œuvre nécessite 2**n * (8 + n * b / 2) stockage (suite...)
...où n est le nombre d'éléments dans le jeu original et b est la taille en octets de chaque élément dans l'ensemble (le 8 est une approximation de la charge requise pour chaque tableau: 4 octets pour la valeur de nombre et de 4 octets pour le pointeur vers le tableau lui-même) (suite...)
...alors que le vôtre pics à seulement environ n * (20 + b * 2) (20 + b est approximative de stockage pour votre dictionnaire), si bien que la mine aurait besoin d'environ 68 GO pour stocker l'ensemble d'une puissance de 30 points 4 octets, la vôtre serait d'utiliser moins de 1 KO à un moment donné.
J'ai changé la mise en œuvre (1) d'utiliser les taux de retour pour la mémoire et (2) cache/réduit calcul de Combinaison. Quand je l'ai couru, mes deux implémentations ont été plus vite que le vôtre quand n>12 ou plus. Le 26, c'est environ 40% plus rapide que le vôtre.

InformationsquelleAutor P Daddy

2

La liste de vos résultats ne correspondent pas aux résultats, votre code peut produire. En particulier, vous ne montrez pas de générer l'ensemble vide.

Si j'ai été la production de powersets qui pourrait avoir quelques milliards de sous-ensembles, puis générer chaque sous-ensemble séparément plutôt que tout à la fois pourrait couper vers le bas sur votre configuration de la mémoire, l'amélioration de votre code de la vitesse. Comment à ce sujet:
```
static class PowerSet<T>
{
static long[] mask = { 1L << 0, 1L << 1, 1L << 2, 1L << 3, 
1L << 4, 1L << 5, 1L << 6, 1L << 7, 
1L << 8, 1L << 9, 1L << 10, 1L << 11, 
1L << 12, 1L << 13, 1L << 14, 1L << 15, 
1L << 16, 1L << 17, 1L << 18, 1L << 19, 
1L << 20, 1L << 21, 1L << 22, 1L << 23, 
1L << 24, 1L << 25, 1L << 26, 1L << 27, 
1L << 28, 1L << 29, 1L << 30, 1L << 31};
static public IEnumerable<IList<T>> powerset(T[] currentGroupList)
{
int count = currentGroupList.Length;
long max = 1L << count;
for (long iter = 0; iter < max; iter++)
{
T[] list = new T[count];
int k = 0, m = -1;
for (long i = iter; i != 0; i &= (i - 1))
{
while ((mask[++m] & i) == 0)
;
list[k++] = currentGroupList[m];
}
yield return list;
}
}
}
```
Puis votre code client ressemble à ceci:
```
    static void Main(string[] args)
{
int[] intList = { 1, 2, 3, 4 };
foreach (IList<int> set in PowerSet<int>.powerset(intList))
{
foreach (int i in set)
Console.Write("{0} ", i);
Console.WriteLine();
}
}
```
Je vais même jeter dans un peu tourner l'algorithme basé sur un modèle avec des arguments pour gratuit. Pour plus de rapidité, vous pouvez enrouler le powerlist() boucle interne dans un dangereux bloc. Il n'a pas beaucoup de différence.

Sur ma machine, ce code est légèrement plus lent que l'OP du code jusqu'à ce que les jeux sont de 16 ans ou plus. Cependant, toutes les heures à 16 éléments sont à moins de 0,15 secondes. À 23 éléments, il s'exécute dans 64% du temps. L'algorithme original ne fonctionne pas sur ma machine pour 24 ou plusieurs éléments -- il est à court de mémoire.

Ce code prend 12 secondes pour générer de la puissance pour les numéros de 1 à 24, en omettant l'écran I/O temps. C'est 16 millions-ish en 12 secondes, soit environ 1400K par seconde. Pour un milliard de dollars (qui est ce que vous avez cité plus haut), qui serait d'environ 760 secondes. Combien de temps pensez-vous que cela devrait prendre?
- Cette solution obtient mon vote -- bien qu'il existe quelques modifications que je vous suggère. déplacer le poids de hamming de calcul pour le début de la boucle interne, donc T[] liste = new T[poids], pas T[count] . Aussi, vos je & (i-1) bits-tourner est un pessimisme, il suffit de faire naïvement.
- Ce que j' & (i -1)? Tu veux dire utiliser: i ^= masque à la fin de la boucle? Qui serait à l'œuvre. Pas clair ce que votre "poids de Hamming" est. Je ne peux pas savoir combien de bits sont définis jusqu'après l'examen d'ensemble de l'int. Plus simple pour allouer de la mémoire max nécessaires. Plus rapide. Pas de pénalité sur la mémoire-création, un à un.
InformationsquelleAutor hughdbrown
1

- T-il C ou C++ une option trop? Si C++, vous pouvez seulement de sa propre list type de la STL. Sinon, vous aurez à mettre en place votre propre liste - rechercher des listes chaînées ou dynamiquement la taille des tableaux de pointeurs sur la façon de le faire.
- N'utilisez pas le C++ liste. C'est complètement différent. En C++, liste est une liste liée. L'équivalent de C#List<T> est std::vector.
InformationsquelleAutor Smokey Bacon Esq.
1

Je suis d'accord avec le "optimiser .NET premier" de l'opinion. C'est la plus indolore. J'imagine que si vous avez écrit quelque gérés .NET code à l'aide de C# pointeurs, il serait identique à C d'exécution, sauf pour le traitement de l'ordinateur virtuel.

InformationsquelleAutor Paul Nathan
0

P Daddy:

Vous pouviez changer de Combinaison() code ce:
```
    static long Combination(long n, long r)
{
r = (r > n - r) ? (n - r) : r;
if (r == 0)
return 1;
long result = 1;
long k = 1;
while (r-- > 0)
{
result *= n--;
result /= k++;
}
return result;
}
```
Cela permettra de réduire la multiplication et la chance de débordement à un minimum.
- C'est une approche intéressante. Il manque le point, cependant. La Performance est l'objectif principal, pas de généralité, et la performance de ce est assez catastrophique, je suis désolé de le dire. Aussi, il souffre des mêmes problèmes de trop-plein avec de grandes entrées (Il apparaît à n = 31 et r = 13). (... suite)
- Dans ce test, cependant, j'ai découvert que beaucoup plus simple de mise en œuvre qui utilise double pour stocker les résultats intermédiaires, dont je savais qu'il serait plus général, est également plus rapide! Je vais changer le mien à nouveau.
- Votre dernière révision est bien mieux, mais encore d'environ 3 à 4 fois plus lente que la virgule flottante version dans mon post. Vous avez échangé des multiplications pour les divisions, mais les divisions (même entier) sont significativement plus lent que les multiplications.
- Ok, générer un tableau de combinaisons et de le mettre dans votre code pour la recherche au moment de l'exécution. Voir le code python iwebthereforeiam.com/files/combination_table.py
InformationsquelleAutor hughdbrown

Vous devez vous connecter pour publier un commentaire.