Ce n'MaxDegreeOfParallelism faire?

Je suis en utilisant en Parallèle.ForEach et je suis en train de faire une base de données mises à jour, maintenant, sans réglage de MaxDegreeOfParallelism , un processeur dual core de la machine des résultats dans sql client, les délais d'attente, où d'autre processeur quad core de la machine en quelque sorte, n'a pas de délai d'attente.

Maintenant, je n'ai aucun contrôle sur ce genre de cœurs de processeur sont disponibles à l'endroit où mon code fonctionne, mais s'il y a des paramètres que je peux changer avec MaxDegreeOfParallelism qui sera probablement moins d'opérations en même temps et pas de résultat dans les délais d'attente?

Je peux augmenter les délais d'attente, mais ce n'est pas une bonne solution, si sur le bas du CPU j'ai peut traiter des opérations, simultanément, qu'il va mettre moins de charge sur le cpu.

Ok, j'ai tout lu d'autres posts et MSDN trop, mais la mise en MaxDegreeOfParallelism à une valeur inférieure faire mon quad core machines souffrir?

Par exemple, est-il de toute façon à faire quelque chose comme, si le CPU a deux cœurs, puis utiliser des 20, si le PROCESSEUR dispose de quatre cœurs de 40?

InformationsquelleAutor Akash Kava | 2012-03-02

.net-4.0 c#parallel-extensions parallel.foreach task-parallel-library

La réponse est que c'est la limite supérieure pour l'ensemble de la marche en parallèle, quel que soit le nombre de cœurs.

Donc, même si vous n'utilisez pas le CPU parce que vous êtes en attente sur IO, ou un verrou, pas de supplément de tâches s'exécutent en parallèle, seul le maximum que vous spécifier.

Pour le savoir, j'ai écrit ce morceau de code de test. Il est artificiel de verrouillage afin de stimuler le TPL d'utiliser plusieurs threads. La même chose se produira lorsque votre code est en attente d'ar ou de la base de données.

class Program
{
    static void Main(string[] args)
    {
        var locker = new Object();
        int count = 0;
        Parallel.For
            (0
             , 1000
             , new ParallelOptions { MaxDegreeOfParallelism = 2 }
             , (i) =>
                   {
                       Interlocked.Increment(ref count);
                       lock (locker)
                       {
                           Console.WriteLine("Number of active threads:" + count);
                           Thread.Sleep(10);
                        }
                        Interlocked.Decrement(ref count);
                    }
            );
    }
}

Si je ne spécifiez pas MaxDegreeOfParallelism, la journalisation de la console indique que jusqu'à environ 8 tâches sont en cours d'exécution en même temps. Comme ceci:

Number of active threads:6
Number of active threads:7
Number of active threads:7
Number of active threads:7
Number of active threads:7
Number of active threads:7
Number of active threads:6
Number of active threads:7
Number of active threads:7
Number of active threads:7
Number of active threads:7
Number of active threads:7
Number of active threads:7
Number of active threads:7
Number of active threads:7
Number of active threads:7
Number of active threads:7
Number of active threads:7
Number of active threads:7

Il commence à un niveau bas, augmente au fil du temps et à la fin, il essaie de 8 en même temps.

Si je me limite à un certain arbitraire de la valeur (disons 2), j'ai

Number of active threads:2
Number of active threads:1
Number of active threads:2
Number of active threads:2
Number of active threads:2
Number of active threads:2
Number of active threads:2
Number of active threads:2
Number of active threads:2
Number of active threads:2
Number of active threads:2
Number of active threads:2
Number of active threads:2
Number of active threads:2
Number of active threads:2
Number of active threads:2
Number of active threads:2

Oh, et c'est sur un quadcore de la machine.

Ma logique n'a aucune attente ou de toute IO, il met juste à jour SQL, oui SQL peut avoir son propre, mais surtout, je suis en attente de SQL à la fin. Qu'est-ce que la valeur par défaut max pas de threads actifs utilisés?
La valeur par défaut est 2 par cœur, mais le TPL peut soulever cette si votre code n'est pas à l'aide de la CPU. La plupart des bases de données impliquent une certaine quantité de IO.
Si ma 6-core, la machine est très chargé, il utilise seulement 1 ou 2 fils. Si sa peu chargé, il va jusqu'à 12. Son assez intelligent pour prendre la charge du système en ligne de compte.
TPL doit être utilisé seulement quand il n'y a pas d'IO impliqués ou que vous faites de l'UC travail intensif

InformationsquelleAutor

15

Par exemple, est-il de toute façon à faire quelque chose comme, si le CPU a deux cœurs, puis utiliser des 20, si le PROCESSEUR dispose de quatre cœurs de 40?

Vous pouvez faire pour rendre le parallélisme dépend du nombre de cœurs de PROCESSEUR:
```
var options = new ParallelOptions { MaxDegreeOfParallelism = Environment.ProcessorCount * 10 };
Parallel.ForEach(sourceCollection, options, sourceItem =>
{
    //do something
});
```
Cependant, de nouveaux CPU ont tendance à utiliser la technologie hyper-threading pour simuler supplémentaire cœurs. Donc, si vous avez un processeur quad-core, puis Environment.ProcessorCount sera probablement en rapport de ce que les 8 coeurs. J'ai trouvé que si vous définissez le parallélisme de compte pour la simulation de carottes puis il ralentit vers le bas les autres threads comme les threads UI.

Si bien que l'opération va se terminer un peu plus rapide, une INTERFACE utilisateur de l'application peut éprouver un retard important au cours de cette période. La division de la `Environnement.ProcessorCount' par 2 semble atteindre les mêmes vitesses de traitement tout en gardant le CPU disponibles pour l'INTERFACE utilisateur de threads.

InformationsquelleAutor bugged87
1

Il semble que le code que vous êtes en cours d'exécution en parallèle est le blocage, ce qui signifie que, à moins que vous pouvez trouver et corriger le problème à l'origine de cela, vous ne devriez pas paralléliser à tous.
- -1, la Question n'est pas sur le point de Parallèle ou de ne pas en parallèle, son simple que SQL fait ses propres calculs, mais trop grand nombre de demandes parallèles rend le client du délai d'attente, je veux exécuter des opérations. L'impasse n'est pas un problème que les quad core de la machine avec la même logique, les mêmes SQL fonctionne très bien, je ne veux pas continuer à augmenter le délai.
- Avez-vous tenté d'augmenter le délai d'expiration et a confirmé que cela fonctionne? Des problèmes de concurrence peuvent être extrêmement subtil, et beaucoup de choses peuvent les faire disparaître et réapparaître apparemment au hasard. Le fait qu'il a travaillé sur une machine différente, avec plus de cœurs ne signifie pas qu'il n'est pas cassé, ou que plus de cœurs ont été la chose qui a aidé.
- L'augmentation de délai d'attente ne l'aide. Mais de toute façon, l'utilisation du PROCESSEUR est plus de 50% sur les petites machines et sur les grosses machines de moins de 5%, maintenant je suis à un point où j'ai besoin de savoir les performances de problème et s'il y a quelque chose que je peux faire pour modifier le code ou faire juste besoin de mise à niveau du PROCESSEUR.
InformationsquelleAutor jimrandomh

Autre chose à considérer, surtout pour les personnes à trouver cela bien des années plus tard, est selon votre situation, il est généralement préférable de recueillir toutes les données dans un DataTable et ensuite utiliser SqlBulkCopy à la fin de chaque tâche majeure.

Par exemple, j'ai un processus que j'ai fait qui s'exécute par des millions de fichiers et j'ai couru dans les mêmes erreurs lors de chaque fichier de transaction de la base de données de requête pour insérer l'enregistrement. J'ai plutôt avancé pour stocker le tout dans un DataTable dans la mémoire pour chaque action je itérer, de dumping de la DataTable dans mon SQL Server et de compensation entre chaque action. Le bulk insert prend une fraction de seconde et a l'avantage de ne pas ouvrir des milliers de connexions à la fois.

EDIT:
Voici un rapide & sale travail exemple
Le SQLBulkCopy méthode:

private static void updateDatabase(DataTable targetTable)
{
try
{
DataSet ds = new DataSet("FileFolderAttribute");
ds.Tables.Add(targetTable);
writeToLog(targetTable.TableName + " - Rows: " + targetTable.Rows.Count, logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
writeToLog(@"Opening SQL connection", logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
Console.WriteLine(@"Opening SQL connection");
SqlConnection sqlConnection = new SqlConnection(sqlConnectionString);
sqlConnection.Open();
SqlBulkCopy bulkCopy = new SqlBulkCopy(sqlConnection, SqlBulkCopyOptions.TableLock | SqlBulkCopyOptions.FireTriggers | SqlBulkCopyOptions.UseInternalTransaction, null);
bulkCopy.DestinationTableName = "FileFolderAttribute";
writeToLog(@"Copying data to SQL Server table", logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
Console.WriteLine(@"Copying data to SQL Server table");
foreach (var table in ds.Tables)
{
writeToLog(table.ToString(), logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
Console.WriteLine(table.ToString());
}
bulkCopy.WriteToServer(ds.Tables[0]);
sqlConnection.Close();
sqlConnection.Dispose();
writeToLog(@"Closing SQL connection", logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
writeToLog(@"Clearing local DataTable...", logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
Console.WriteLine(@"Closing SQL connection");
Console.WriteLine(@"Clearing local DataTable...");
targetTable.Clear();
ds.Tables.Remove(targetTable);
ds.Clear();
ds.Dispose();
}
catch (Exception error)
{
errorLogging(error, getCurrentMethod(), logDatabaseFile);
}
}

...et pour les déverser dans la datatable:

private static void writeToDataTable(string ServerHostname, string RootDirectory, string RecordType, string Path, string PathDirectory, string PathFileName, string PathFileExtension, decimal SizeBytes, decimal SizeMB, DateTime DateCreated, DateTime DateModified, DateTime DateLastAccessed, string Owner, int PathLength, DateTime RecordWriteDateTime)
{
try
{
if (tableToggle)
{
DataRow toInsert = results_1.NewRow();
toInsert[0] = ServerHostname;
toInsert[1] = RootDirectory;
toInsert[2] = RecordType;
toInsert[3] = Path;
toInsert[4] = PathDirectory;
toInsert[5] = PathFileName;
toInsert[6] = PathFileExtension;
toInsert[7] = SizeBytes;
toInsert[8] = SizeMB;
toInsert[9] = DateCreated;
toInsert[10] = DateModified;
toInsert[11] = DateLastAccessed;
toInsert[12] = Owner;
toInsert[13] = PathLength;
toInsert[14] = RecordWriteDateTime;
results_1.Rows.Add(toInsert);
}
else
{
DataRow toInsert = results_2.NewRow();
toInsert[0] = ServerHostname;
toInsert[1] = RootDirectory;
toInsert[2] = RecordType;
toInsert[3] = Path;
toInsert[4] = PathDirectory;
toInsert[5] = PathFileName;
toInsert[6] = PathFileExtension;
toInsert[7] = SizeBytes;
toInsert[8] = SizeMB;
toInsert[9] = DateCreated;
toInsert[10] = DateModified;
toInsert[11] = DateLastAccessed;
toInsert[12] = Owner;
toInsert[13] = PathLength;
toInsert[14] = RecordWriteDateTime;
results_2.Rows.Add(toInsert);
}
}
catch (Exception error)
{
errorLogging(error, getCurrentMethod(), logFile);
}
}

...et voici le contexte, la boucle de la pièce elle-même:

private static void processTargetDirectory(DirectoryInfo rootDirectory, string targetPathRoot)
{
DateTime StartTime = DateTime.Now;
int directoryCount = 0;
int fileCount = 0;
try
{                
manageDataTables();
Console.WriteLine(rootDirectory.FullName);
writeToLog(@"Working in Directory: " + rootDirectory.FullName, logFile, getLineNumber(), getCurrentMethod(), true);
applicationsDirectoryCount++;
//REPORT DIRECTORY INFO //
string directoryOwner = "";
try
{
directoryOwner = File.GetAccessControl(rootDirectory.FullName).GetOwner(typeof(System.Security.Principal.NTAccount)).ToString();
}
catch (Exception error)
{
//writeToLog("\t" + rootDirectory.FullName, logExceptionsFile, getLineNumber(), getCurrentMethod(), true);
writeToLog("[" + error.Message + "] - " + rootDirectory.FullName, logExceptionsFile, getLineNumber(), getCurrentMethod(), true);
errorLogging(error, getCurrentMethod(), logFile);
directoryOwner = "SeparatedUser";
}
writeToRawLog(serverHostname + "," + targetPathRoot + "," + "Directory" + "," + rootDirectory.Name + "," + rootDirectory.Extension + "," + 0 + "," + 0 + "," + rootDirectory.CreationTime + "," + rootDirectory.LastWriteTime + "," + rootDirectory.LastAccessTime + "," + directoryOwner + "," + rootDirectory.FullName.Length + "," + DateTime.Now + "," + rootDirectory.FullName + "," + "", logResultsFile, true, logFile);
//writeToDBLog(serverHostname, targetPathRoot, "Directory", rootDirectory.FullName, "", rootDirectory.Name, rootDirectory.Extension, 0, 0, rootDirectory.CreationTime, rootDirectory.LastWriteTime, rootDirectory.LastAccessTime, directoryOwner, rootDirectory.FullName.Length, DateTime.Now);
writeToDataTable(serverHostname, targetPathRoot, "Directory", rootDirectory.FullName, "", rootDirectory.Name, rootDirectory.Extension, 0, 0, rootDirectory.CreationTime, rootDirectory.LastWriteTime, rootDirectory.LastAccessTime, directoryOwner, rootDirectory.FullName.Length, DateTime.Now);
if (rootDirectory.GetDirectories().Length > 0)
{
Parallel.ForEach(rootDirectory.GetDirectories(), new ParallelOptions { MaxDegreeOfParallelism = directoryDegreeOfParallelism }, dir =>
{
directoryCount++;
Interlocked.Increment(ref threadCount);
processTargetDirectory(dir, targetPathRoot);
});
}
//REPORT FILE INFO //
Parallel.ForEach(rootDirectory.GetFiles(), new ParallelOptions { MaxDegreeOfParallelism = fileDegreeOfParallelism }, file =>
{
applicationsFileCount++;
fileCount++;
Interlocked.Increment(ref threadCount);
processTargetFile(file, targetPathRoot);
});
}
catch (Exception error)
{
writeToLog(error.Message, logExceptionsFile, getLineNumber(), getCurrentMethod(), true);
errorLogging(error, getCurrentMethod(), logFile);
}
finally
{
Interlocked.Decrement(ref threadCount);
}
DateTime EndTime = DateTime.Now;
writeToLog(@"Run time for " + rootDirectory.FullName + @" is: " + (EndTime - StartTime).ToString() + @" | File Count: " + fileCount + @", Directory Count: " + directoryCount, logTimingFile, getLineNumber(), getCurrentMethod(), true);
}

Comme indiqué ci-dessus, c'est rapide & sale, mais fonctionne très bien.

Pour des problèmes de mémoire, j'ai couru dans une fois que je suis à environ 2 000 000 d'enregistrements, j'ai dû créer un deuxième DataTable et alterner entre les 2, le dumping des dossiers à SQL server entre l'alternance. Donc, mes connexions SQL se composent de 1 tous les 100 000 entrées.

J'ai réussi que comme ceci:

private static void manageDataTables()
{
try
{
Console.WriteLine(@"[Checking datatable size] toggleValue: " + tableToggle + " | " + @"r1: " + results_1.Rows.Count + " - " + @"r2: " + results_2.Rows.Count);
if (tableToggle)
{
int rowCount = 0;
if (results_1.Rows.Count > datatableRecordCountThreshhold)
{
tableToggle ^= true;
writeToLog(@"results_1 row count > 100000 @ " + results_1.Rows.Count, logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
rowCount = results_1.Rows.Count;
logResultsFile = "FileServerReport_Results_" + DateTime.Now.ToString("yyyyMMdd-HHmmss") + ".txt";
Thread.Sleep(5000);
if (results_1.Rows.Count != rowCount)
{
writeToLog(@"results_1 row count increased, @ " + results_1.Rows.Count, logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
rowCount = results_1.Rows.Count;
Thread.Sleep(15000);
}
writeToLog(@"results_1 row count stopped increasing, updating database...", logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
updateDatabase(results_1);
results_1.Clear();
writeToLog(@"results_1 cleared, count: " + results_1.Rows.Count, logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
}
}
else
{
int rowCount = 0;
if (results_2.Rows.Count > datatableRecordCountThreshhold)
{
tableToggle ^= true;
writeToLog(@"results_2 row count > 100000 @ " + results_2.Rows.Count, logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
rowCount = results_2.Rows.Count;
logResultsFile = "FileServerReport_Results_" + DateTime.Now.ToString("yyyyMMdd-HHmmss") + ".txt";
Thread.Sleep(5000);
if (results_2.Rows.Count != rowCount)
{
writeToLog(@"results_2 row count increased, @ " + results_2.Rows.Count, logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
rowCount = results_2.Rows.Count;
Thread.Sleep(15000);
}
writeToLog(@"results_2 row count stopped increasing, updating database...", logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
updateDatabase(results_2);
results_2.Clear();
writeToLog(@"results_2 cleared, count: " + results_2.Rows.Count, logDatabaseFile, getLineNumber(), getCurrentMethod(), true);
}
}
}
catch (Exception error)
{
errorLogging(error, getCurrentMethod(), logDatabaseFile);
}
}

Où "datatableRecordCountThreshhold = 100000"

un exemple de code serait génial.
"Sans nom": j'ai ajouté un peu de travail, des exemples de code. Le code peut ne pas être la meilleure forme (style, les meilleures pratiques-sage), mais j'étais en train d'apprendre comment faire ces choses à la volée, et tout cela fonctionne. Je compile contre 4.6.2 si il le faut.

InformationsquelleAutor grep65535

-3

il détermine le nombre de threads de s'exécuter en parallèle...
- Mais ne il prendre des carottes en considération?
- fondamentalement, ce type de db que vous utilisez?
- Même OS, Même Programme, les Mêmes Données (Réplicateurs bascially) ,mais l'un est un haut de gamme de la machine avec double quad core, et les deux sont de simples dual core machines, même programme récupère des données à partir d'autres serveurs et les magasins de données SQL (beaucoup de gouttes et images).
- combien de fils parallèles que vous essayez d'utiliser? et qu'est-ce que la db de la plate-forme?
- Eh bien, j'ai la liste des 100 requêtes pour être exécuté à chaque parallèle, j'ai donc fait en Parallèle.ForEach(queryList,exécuter)... , je pense que je vais essayer ParallelOptions.MaxDegreeOfParallelism = Environnement.ProcessorCount * 20, ou comme cela.
- si vous utilisez sqlite db, il va vous jeter une exception. autre que cela, je pense que vous devriez être très bien, même avec 1000 threads...
- non, SQL SERVER, mais il implique de lourdes gouttes de mise à jour.
- Je pense que cela va faire ok.. mais ne pas utiliser trop de threads.. 100 devrait être suffisant...
- Il n'a certainement pas définir le nombre de threads de s'exécuter en parallèle. Dans la pratique, il peut spécifier le nombre maximal de threads de s'exécuter en parallèle, mais ce n'est pas son contrat. En réalité, cette limite est le nombre de l'exécution simultanée d' activités, qui peut ou non correspondre aux threads, mais c'est une abstraction de détail d'implémentation.
InformationsquelleAutor SolidSnake

Vous devez vous connecter pour publier un commentaire.