Comment mesurer le noyau temps en NVIDIA CUDA?

Je veux mesurer le temps interne du noyau de GPU, comment le mesurer dans CUDA de NVIDIA?
par exemple,

__global__ void kernelSample()
{
  some code here
  get start time 
  some code here 
  get stop time 
  some code here
}
Amin, (il y a quelques années) que vous avez accepté la réponse qui est utile, mais ne répond pas à votre question. Auriez-vous l'esprit des nations unies-l'acceptation ou de la modification de la question afin de refléter la réponse peut-être?

OriginalL'auteur Amin | 2012-05-14