Repères de comparer Intel Xeon Phi et Nvidia Tesla K20
À ma grande surprise, je ne peux pas trouver une comparaison de ces produits en utilisant l'open source OpenCL référence suites, comme rodinia et SHOC. Une telle comparaison pourrait être plus intéressant que les comparaisons théoriques des performances de pointe, ou de la performance de la simple multiplication de matrice de grains, que j'ai pu trouver.
Personne ne sait où de tels résultats pourraient être disponibles? À défaut, n'importe quel débordement de pile les utilisateurs ont accès à un ou deux produits, et le temps et l'envie de courir les points de référence et de partager les résultats? Résultats pour toutes les versions de ces cartes serait intéressant.
Xeon Phi prend en charge OpenCL, mais il est encore en phase bêta: software.intel.com/en-us/vcsource/tools/opencl-sdk-xe
J'ai accès à la fois à mon lieu de travail. Vous êtes à la recherche pour opencl performance sur k20 ou les performances cuda ?
Leur construction est de plus en plus de douleur pour moi le week-end (pas jouer gentil avec cuda 5.0). Je vais essayer de revenir plus tard cette semaine.
Avez-vous eu le temps de courir les points de repère sur les Xeon Phi? (Je ne crois pas à l'analyse comparative CUDA est fine).
OriginalL'auteur Matt | 2013-01-19
Vous devez vous connecter pour publier un commentaire.
CLBenchmark.com a maintenant quelques résultats pour la Xeon Phi, et un ensemble complet pour la K20c.
Ici est un side-by-side de comparaison.
OriginalL'auteur Matt
Ici est une comparaison des Xeon Phi avec une GTX Titan.
http://clbenchmark.com/compare.jsp?config_0=14470292&config_1=15887974
Le Xeon Phi fondamentalement devient complètement détruite dans le 10/12 repères et est le même pour les 2 autres. Si la 300 watt 22 nm Phi partie n'est pas loin, bien à contre-250 watt 28 nm GPU.
Fondamentalement, le Phi semble avoir des troubles majeurs en utilisant la capacité de la bande passante, la vectorisation le code semble être une autre question.
OriginalL'auteur Jimmy Pettersson
Ici est une référence de la comparaison de matrices creuses à la multiplication des performances:
http://uk.arxiv.org/abs/1302.1078
En partie des réponses à ma question, mais j'aimerais voir plus d'un algorithme, et je voudrais voir comment portable OpenCL performance est, je vais encore accepter toutes les réponses qui peuvent leur fournir cette information.
OriginalL'auteur Matt
SHOC suite de test pour les Xeon Phi est sur github ici:
Intel Xeon Phi SHOC Suite de Test
Beaucoup de référence offres commencent à remonter le public et les "googlable", mais ici, c'est le standard Intel communication sur l'analyse comparative de Xeon Phi rapport à une double prise E5-2670:
Intel Xeon Phi Performance Doc.
Lors de la recherche pour comparer les performances des Xeon Phi régulier Xeon, ou toute autre plate-forme, assurez-vous que vous êtes en tenant compte de la puissance de l'enveloppe de la plate-forme (dual-socket Xeon) et si la demande a déjà été réglé pour un Xeon ou pas. L'un des grands vend sur le Xeon Phi est que vous obtenez généralement Xeon améliorations en plus de Xeon Phi améliorations. Assez doux..
Je suis certain que ce n'est pas le cas à plus long terme... Il est plus probable que quelqu'un travaille dans une branche locale et ils vont la pousser à github bientôt.
OriginalL'auteur MikeWade