OpenMP: Quel est l'avantage de l'imbrication des parallélisations?

De ce que je comprends, #pragma omp parallel et de ses variations fondamentalement exécuter le bloc suivant dans un certain nombre de threads simultanés, ce qui correspond au nombre de Processeurs. Lorsque imbriquée parallelizations - parallèle dans parallèle, parallèle à l'intérieur de fonction parallèle etc. - ce qui se passe à l'intérieure de la parallélisation?

Je suis nouveau sur OpenMP, et le cas que j'ai en tête est plutôt trivial - multiplication d'un vecteur par une matrice. Ceci est fait en deux boucles for imbriquées. En supposant que le nombre de Processeurs est plus petit que le nombre d'éléments dans le vecteur, est-il un avantage en essayant de lancer la boucle interne en parallèle? Sera le nombre total de threads être plus grand que le nombre de Processeurs, ou la boucle intérieure être exécutées de manière séquentielle?

source d'informationauteur eran