Comment calculer l'ordre (grand O) pour des algorithmes plus complexes (par exemple quicksort)

Je sais qu'il y a tout un tas de questions à propos de big O la notation, j'ai déjà vérifié:

pour n'en nommer que quelques-unes.

Je sais par "intuition" comment le calculer pour n, n^2, n! et, donc, mais je suis complètement perdu sur la façon de la calculer pour les algorithmes qui sont log n , n log n, n log log n et si.

Ce que je veux dire, je sais que le Tri Rapide est n log n (en moyenne).. mais, pourquoi? Même chose pour la fusion/peigne, etc.

Quelqu'un pourrait-il m'expliquer en un pas trop les maths-y comment calculez-vous cela?

La raison principale est que Im sur le point d'avoir un gros entretien, et je suis sûr qu'ils vont vous demander ce genre de choses. J'ai fait des recherches depuis quelques jours maintenant, et tout le monde semble avoir une explication de pourquoi le tri à bulles est n^2 ou illisible explication (pour moi) sur Wikipédia

InformationsquelleAutor Francisco Noriega | 2010-04-12

41

Le logarithme est l'opération inverse de l'exponentiation. Un exemple de l'exponentiation est lorsque l'on double le nombre d'éléments à chaque étape. Ainsi, une échelle logarithmique de l'algorithme de souvent de moitié le nombre d'éléments à chaque étape. Par exemple, la recherche binaire tombe dans cette catégorie.

De nombreux algorithmes nécessitent un nombre logarithmique de grands pas, mais à chaque grande étape nécessite O(n) unités de travail. Mergesort tombe dans cette catégorie.

Habituellement, vous pouvez identifier ces types de problèmes par la visualisation d'un arbre binaire équilibré. Voici par exemple la fusion de tri:
```
 6   2    0   4    1   3     7   5
  2 6      0 4      1 3       5 7
    0 2 4 6            1 3 5 7
         0 1 2 3 4 5 6 7
```
En haut à l'entrée, comme les feuilles de l'arbre. L'algorithme crée un nouveau nœud en triant les deux nœuds au-dessus d'elle. Nous savons que la hauteur d'un arbre binaire équilibré est O(log n) il y a donc O(log n) grandes étapes. Toutefois, la création de chaque nouvelle ligne prend O(n) de travail. O(log n) grandes étapes de O(n) le travail de chacun que mergesort est O(n log n) dans l'ensemble.

Généralement, O(log n) algorithmes de ressembler à la fonction ci-dessous. Ils arrivent à jeter la moitié des données à chaque étape.
```
def function(data, n):
    if n <= constant:
       return do_simple_case(data, n)
    if some_condition():
       function(data[:n/2], n /2) # Recurse on first half of data
    else:
       function(data[n/2:], n - n /2) # Recurse on second half of data
```
Tout en O(n log n) algorithmes de ressembler à la fonction ci-dessous. Ils séparent les données dans la moitié, mais ils doivent tenir compte de ces deux moitiés.
```
def function(data, n):
    if n <= constant:
       return do_simple_case(data, n)
    part1 = function(data[n/2:], n /2)      # Recurse on first half of data
    part2 = function(data[:n/2], n - n /2)  # Recurse on second half of data
    return combine(part1, part2)
```
Où do_simple_case() prend O(1) fois et de les combiner() ne prend pas plus de O(n) fois.

Les algorithmes n'ont pas besoin de diviser les données exactement de moitié. Ils pourraient diviser en un tiers et deux tiers, et que ce serait bien. Pour le cas moyen de la performance, de la scission en deux en moyenne est suffisante (comme QuickSort). Tant que la récursivité est fait sur des morceaux de (n/quelque chose) et (n - n/quelque chose), c'est correct. Si c'est le brisant en (k) et (n-k), alors la hauteur de l'arbre sera en O(n) et pas de O(log n).
- J'aime vraiment votre explication, il fait, il est facile de comprendre pourquoi et comment les identifier, merci!
InformationsquelleAutor Daniel Stutzbach
14

Vous pouvez généralement revendication de log n pour les algorithmes où il moitiés de l'espace/temps, à chaque fois qu'il exécute. Un bon exemple de ceci est un binaire de l'algorithme (par exemple, la recherche binaire). Vous choisissez soit de gauche ou de droite, qui ensuite les axes de l'espace que vous êtes à la recherche de moitié. Le modèle de reprises de faire la moitié est log n.
- oui exactement. Il convient de mentionner que dans CS log signifie logarithme base 2 au lieu de la base 10, qui est normalement supposé. journal n signifie que le numéro qui vous aurait à augmenter de 2 à n. donc journal 8 est de 3, journal 16 est de 4, etc...
- En fait c'est un peu trompeuse erreur de segmentation. Alors que le journal fait référence à la base 2 en général, en termes de big Oh la notation n'a pas d'importance. O(log_2 (n) ) est équivalent à O(log_k (n) ), parce que log_k (n) = log_k (2) * log_2 (n). C'est juste une simplification de la modification de la base de journal de formule: log_k(a)/log_k(b) = log_b (un). Ensuite, parce que les log_k (2) est une constante de la big oh est clairement équivalent.
- plus au point, big-O complexité ne permet pas de prendre en compte des facteurs constants, et la différence entre log_e et log_2 est seulement un facteur constant.
- Merci pour les précisions les gars.
- Grande réponse. Considérant combien de fois ce post a été vu, je suis surpris que cela n'a pas eu plus upvotes.
InformationsquelleAutor Jeremy L
6

Pour certains algorithmes, l'obtention d'un serré en partance pour le temps d'exécution par le biais de l'intuition est presque impossible (je ne pense pas que je vais jamais être capable de deviner un O(n log log n) temps d'exécution, par exemple, et je doute que quelqu'un pourra jamais attendre de vous que vous). Si vous pouvez obtenir vos mains sur le CLRS Introduction aux Algorithmes de texte, vous trouverez un joli traitement approfondi de notation asymptotique qui est appropriée rigoureux sans être complètement opaque.

Si l'algorithme est récursif, un moyen simple de tirer un encadrement est d'écrire une récidive et pour le résoudre, soit de manière itérative ou à l'aide de la Maître Théorème ou d'une autre façon. Par exemple, si vous ne cherchez pas à être super rigoureux à ce sujet, la meilleure façon d'obtenir QuickSort est temps d'exécution est à travers le Maître Théorème -- QuickSort implique de partitionnement de la matrice en deux relativement égale des sous-tableaux (il devrait être assez intuitif de voir que c'est O(n)), et puis l'appel de QuickSort de manière récursive sur ces deux sous-tableaux. Ensuite, si nous les laissons T(n) désigner le temps d'exécution, nous avons T(n) = 2T(n/2) + O(n), qui, par le Maître de la Méthode est O(n log n).
- +1 pour Le Big Livre Blanc. (Oui, même pensé que c'est surtout le vert maintenant, il sera TOUJOURS TBWB.)
- En fait une troisième édition a été récemment publié, de sorte que c'est surtout le bleu.
InformationsquelleAutor Ismail Badawi
4

Découvrez le "phone book" exemple donné ici: Qu'est ce qu'un anglais simple explication de la "Big O" notation?

Rappelez-vous que Big-O est tout au sujet de échelle: comment faire beaucoup plus d'opération de cet algorithme nécessite que l'ensemble de données se développe?

O(log n) règle générale, vous pouvez couper le jeu de données en deux à chaque itération (par exemple, la recherche binaire)

O(n log n) signifie que vous effectuez un O(log n) opérations de pour chaque élément dans votre jeu de données

~~je suis assez sûr " O(n log log n)' n'a pas de sens. Ou si elle le fait, elle simplifie en bas à O(n log n).~~
- 😀 Im assez le super court "signifie généralement" extrait sera très utile pour rapide sur place "analyse" sur la n log n log... je n'ai pas vraiment vu de ces algorithmes, mais je tombe sur cet ordre alors que dans ma recherche.. apparemment han et thorup sont un exemple de cette en.wikipedia.org/wiki/Sorting_algorithm
- O(n log log n) algorithmes existent. Par exemple: portal.acm.org/citation.cfm?id=975984
- O(n log log n) algorithmes sont généralement simplifiés à O(n), comme le journal le journal de n est incroyable petit, par exemple le journal le journal de (2^64) = 6.
- Alors que la vitesse de succès pour le journal le journal de n terme est minuscule, il est inexact de décrire un O(n log log n) algorithme O(n). C'est comme dire que le 3 est égal à 4 pour suffisamment grandes valeurs de 3.
- Oui, je ne veux pas dire qu'ils sont égaux, c'est juste que O(loglogn) peut, dans la plupart des cas, être traités comme O(1). Allant de N=2^32 pour N=2^64 augmente loglogn de 5 à 6. Pour arriver à 7, vous devez augmenter la N de la 2^128. Ce type de croissance est si lent qu'il ressemble à plat. Pour les fins de la recherche universitaire et de la connaissance générale, vous êtes bien sûr le droit, mais dans l'application de la loglogn facteur qui est généralement ignoré.
InformationsquelleAutor keithjgrant
3

Je vais tenter de faire une analyse intuitive de pourquoi Mergesort est n log n, et si vous pouvez me donner un exemple de n log log n de l'algorithme, je peux travailler à travers elle aussi.

Mergesort est un exemple de tri qui fonctionne par le partage d'une liste d'éléments à plusieurs reprises jusqu'à ce que seuls les éléments et la combinaison de ces listes ensemble. Le fonctionnement principal dans chacun de ces fusions est la comparaison et chaque fusion nécessite tout au plus n comparaisons où n est la longueur des deux listes combinées. À partir de ce que vous pouvez tirer de la récidive et de résoudre facilement, mais nous allons éviter cette méthode.

Plutôt de considérer comment Mergesort va se comporter, nous allons faire une liste et de le diviser, puis prendre les moitiés et de diviser à nouveau, jusqu'à ce que nous avons n partitions de longueur 1. J'espère qu'il est facile de voir que cette récursivité ne vont log (n) de profondeur jusqu'à ce que nous avons divisé la liste dans notre n partitions.

Maintenant que nous avons que chacun de ces n partitions doivent être fusionnées, puis une fois ceux-ci sont regroupées au niveau suivant devront être fusionnés, jusqu'à ce que nous avons une liste de longueur n de nouveau. Reportez-vous à la page wikipedia graphique pour un exemple simple de ce processus http://en.wikipedia.org/wiki/File:Merge_sort_algorithm_diagram.svg.

Maintenant tenir compte de la quantité de temps que prendra ce processus, nous allons avoir log (n) les niveaux et à chaque niveau, nous aurons à la fusion de toutes les listes. Il s'avère que chaque niveau prendra n le temps de fusion, parce que nous allons la fusion d'un total de n éléments à chaque fois. Ensuite, vous pouvez assez facilement voir qu'il va prendre la n log (n) le temps de trier un tableau avec mergesort si vous prenez l'opération de comparaison pour être l'opération la plus importante.

Si quelque chose n'est pas clair ou j'ai sauté quelque part s'il vous plaît laissez-moi savoir et je peux essayer d'être plus verbeux.

Modifier La Seconde Explication:

Laissez-moi réfléchir, si je peux vous expliquer cela mieux.

Le problème est décomposé en un tas de petites listes et puis les petites listes sont triées et regroupées jusqu'à ce que vous revenir à la liste originale qui est maintenant triée.

Lorsque vous cassez les problèmes que vous avez plusieurs niveaux de la taille d'abord vous allez avoir deux listes de taille: n/2, n/2, alors au prochain niveau, vous aurez quatre listes de taille: n/4, n/4, n/4, n/4, au niveau suivant, vous devrez n/8, n/8 ,n/8 ,n/8, n/8, n/8 ,n/8 ,n/8 cela continue jusqu'à n/2^k est égal à 1 (chaque subdivision est la longueur divisée par une puissance de 2, et non pas toutes les longueurs sera divisible par quatre, alors il ne sera pas tout à fait cette jolie). Cela est répété à la division par deux et peuvent continuer à la plupart des log_2(n) fois, parce que 2^(log_2(n) )=n, donc plus de division par 2 devrait permettre d'obtenir une liste de taille zéro.

Maintenant, la chose importante à noter est qu'à chaque niveau on a n d'éléments pour chaque niveau de la fusion prendra n le temps, parce que la fusion est une opération linéaire. Si il y a log(n), les niveaux de la récursivité ensuite, nous allons effectuer cette opération linéaire log(n) fois, par conséquent, notre temps de course sera n log(n).

Désolé si ce n'est pas très utile.
- Merci, j'aime bien ton explication, car il me donne les moyens de le faire pour d'autres types d'algorithmes.. mais je dans cette partie: Ensuite, vous pouvez assez facilement voir qu'il va prendre la n log (n) le temps de trier un tableau avec mergesort si vous prenez l'opération de comparaison pour être l'opération la plus importante. il n'était pas si facile à voir pour moi.. mais il complétée avec d'autres personnes de réponse (quand vous devez l'appliquer log(n) opération à chacun de vous de n éléments)... c'est la façon dont vous "facilement vu"qu'il devient n*logn?
- Mise à jour du mieux que je pouvais.
- Bonne explication, merci!
InformationsquelleAutor JSchlather
0

Lors de l'application d'un divide-and-conquer algorithme où vous partition le problème en sous-problèmes jusqu'à ce qu'il est si simple qu'il est trivial, si le partitionnement se passe bien, la taille de chaque sous-problème est n/2 ou penser de cela. C'est souvent à l'origine de la log(n) que les cultures en place dans le big-O de la complexité: O(log(n)) est le nombre d'appels récursifs nécessaire lors du partitionnement va bien.
- Oui, mais diviser et conquérir les algorithmes sont généralement n log(n), parce que pendant que vous diviser le problème en plus petits et les plus petits morceaux il y a généralement une opération qui n fois dans la longueur de la partition qui doit être effectué à chaque étape.
- Je ne pense pas que c'est vrai. Le travail effectué dans chaque itération n'a généralement pas de relation à n, c'est juste une (plus ou moins) constante de la quantité de traitement. Puisque les constantes sont ignorés dans le Big-O de notation, un divide-and-conquer algorithme de type binaire de recherche est O(log n).
- Recherche binaire n'est pas vraiment diviser pour régner, c'est plus ce qu'on pourrait appeler de la diminution et de la conquête. Des algorithmes tels que Mergesort, tri rapide, FFT, etc sont à diviser et conquérir. Ce n'est pas vraiment diviser et conquérir, sauf si vous êtes décompose le problème en petits sous-problèmes et la résolution de ceux, ensuite, à l'aide de ces solutions pour résoudre des problèmes plus graves.
- Certains manuels comprennent une diminution et de la conquête" de la catégorie. D'autres manuels de groupe deux types d'algorithmes pair dans le "diviser pour régner" de la catégorie.
InformationsquelleAutor Pascal Cuoq

Vous devez vous connecter pour publier un commentaire.