Comment obtenir la composante Y de CMSampleBuffer résulte de la AVCaptureSession?

Hé là, je suis en train d'essayer d'accéder à des données brutes à partir de l'iphone appareil photo à l'aide AVCaptureSession. J'ai suivi le guide fourni par Apple (lien ici).

Les données brutes de l'samplebuffer est en format YUV ( Suis-je corriger là sur la vidéo raw image format?? ), comment l'obtenir directement les données pour la composante Y de la des données brutes stockées dans la samplebuffer.

Les deux Brad Larson et Codo m'a beaucoup aidé sur ce problème. Avec la combinaison de leurs réponses, j'ai enfin pu atteindre mon objectif. Merci beaucoup, Brad Larson et Codo !

InformationsquelleAutor Nihao | 2010-11-03

20

Lors de la configuration de la AVCaptureVideoDataOutput qui renvoie les premières images de la caméra, vous pouvez définir le format des images à l'aide du code suivant:
```
[videoOutput setVideoSettings:[NSDictionary dictionaryWithObject:[NSNumber numberWithInt:kCVPixelFormatType_32BGRA] forKey:(id)kCVPixelBufferPixelFormatTypeKey]];
```
Dans ce cas, un BGRA pixels format est spécifié (j'ai utilisé ça pour faire correspondre un format de couleur pour une texture OpenGL ES). Chaque pixel dans ce format a un octet pour le bleu, le vert, le rouge, et alpha, dans cet ordre. Va avec cela le rend facile de sortir des composants de la couleur, mais vous n'sacrifier un peu de la performance par un besoin de faire la conversion à partir de la caméra natif espace colorimétrique YUV.

Les autres espaces de couleurs sont kCVPixelFormatType_420YpCbCr8BiPlanarVideoRange et kCVPixelFormatType_420YpCbCr8BiPlanarFullRange sur les périphériques les plus récents et kCVPixelFormatType_422YpCbCr8 sur l'iPhone 3G. Le VideoRange ou FullRange suffixe indique simplement si les octets sont retournés entre 16 et 235 pour Y et 16 - 240 pour les UV ou complète de 0 à 255 pour chaque composant.

Je crois que l'espace colorimétrique par défaut utilisé par un AVCaptureVideoDataOutput exemple est le YUV 4:2:0 plane palette (à l'exception de l'iPhone 3G, où il est en YUV 4:2:2 interleaved). Cela signifie qu'il existe deux plans de l'image, les données contenues dans l'image vidéo, avec l'axe de l'avion vient en premier. Pour chaque pixel de votre image qui en résulte, il y a un octet pour la valeur de Y à ce pixel.

Vous donneriez à cette matière première en Y de données par la mise en œuvre de quelque chose comme ceci dans votre délégué de rappel:
```
- (void)captureOutput:(AVCaptureOutput *)captureOutput didOutputSampleBuffer:(CMSampleBufferRef)sampleBuffer fromConnection:(AVCaptureConnection *)connection
{
    CVImageBufferRef pixelBuffer = CMSampleBufferGetImageBuffer(sampleBuffer);
    CVPixelBufferLockBaseAddress(pixelBuffer, 0);

    unsigned char *rawPixelBase = (unsigned char *)CVPixelBufferGetBaseAddress(pixelBuffer);

    //Do something with the raw pixels here

    CVPixelBufferUnlockBaseAddress(pixelBuffer, 0);
}
```
Vous pouvez ensuite déterminer l'emplacement dans le bloc de données pour chaque coordonnée X, Y sur l'image et tirez l'octet de sortie qui correspond à la composante Y à coordonner.

Apple FindMyiCone échantillon de La WWDC 2010 (accessible avec les vidéos) montre comment traiter les matières premières BGRA des données à partir de chaque image. J'ai également créé un exemple d'application, que vous pouvez télécharger le code pour ici, qui effectue basée sur la couleur de suivi d'objet à l'aide de la vidéo en direct de la la caméra de l'iPhone. Les deux montrent comment traiter les matières premières des données de pixels, mais aucune de ces travaux dans l'espace colorimétrique YUV.
- brad Larson :Si kCVPixelFormatType_420YpCbCr8BiPlanarvideorange(iphone4 par défaut) et YUV 420 sont les mêmes??
- Comme je le mentionne ci-dessus, kCVPixelFormatType_420YpCbCr8BiPlanarVideoRange sur l'iPhone 4 est un YUV 4:2:0 plane palette.
- j'ai une autre Question.Mon codec accepter seulement YUV420 format , mais 420YpCbCr8BiPlanarVideoRange (biplanar )format de données Y (luminance) et le Rsarf de données (chroma ou de la couleur de l'information) sont dans deux zones de mémoire appelé avions,Comment puis-je envoyer mon codec ?Aucun moyen de convertir simple planaire? Si je dois utiliser tout spl conversion
- Si votre codec exige entrelacés YUV données, vous devrez peut-être faire l'entrelacement de vous-même en utilisant l'Accélérer cadre ou un shader personnalisée. Toutefois, sans porter atteinte à NDA, vous pouvez lire quelques notes de mise à jour sur iOS 5.0.
- Que la couleur de démonstration du suivi n'est pas le droit de travailler maintenant. Veuillez mettre à jour votre réponse. Je veux mettre en œuvre ce genre de choses. Merci... 🙂
- Cet exemple d'application a été remplacée par la ColorObjectTracking exemple dans mon GPUImage cadre: github.com/BradLarson/GPUImage/tree/master/examples/iOS/...
InformationsquelleAutor Brad Larson
18

En plus de sa réponse, et de votre propre code, vous voulez envisager la suivante:

Depuis votre image a deux plans distincts, la fonction CVPixelBufferGetBaseAddress ne sera pas de retour l'adresse de base de l'avion, mais plutôt l'adresse de base d'une structure de données supplémentaires. C'est probablement dû à la mise en œuvre actuelle que vous obtenez une adresse assez proche du premier plan, de sorte que vous pouvez voir l'image. Mais c'est la raison pour laquelle il est déplacé et a poubelle en haut à gauche. La bonne façon de recevoir le premier plan est:
```
unsigned char *rowBase = CVPixelBufferGetBaseAddressOfPlane(pixelBuffer, 0);
```
Une ligne de l'image peut être plus long que la largeur de l'image (en raison de l'arrondissement). C'est pourquoi il existe des fonctions pour obtenir la largeur et le nombre d'octets par ligne. Vous n'avez pas ce problème pour le moment. Mais cela pourrait changer avec la prochaine version d'iOS. Ainsi, votre code devrait être:
```
int bufferHeight = CVPixelBufferGetHeight(pixelBuffer);
int bufferWidth = CVPixelBufferGetWidth(pixelBuffer);
int bytesPerRow = CVPixelBufferGetBytesPerRowOfPlane(pixelBuffer, 0);
int size = bufferHeight * bytesPerRow ;

unsigned char *pixel = (unsigned char*)malloc(size);

unsigned char *rowBase = CVPixelBufferGetBaseAddressOfPlane(pixelBuffer, 0);
memcpy (pixel, rowBase, size);
```
Veuillez également noter que votre code va lamentablement échouer sur un iPhone 3G.
- Merci beaucoup!. Qui fonctionne parfaitement pour moi 😀
- Ne devrait-elle pas être CVPixelBufferGetHeightOfPlane? Juste curieux.
- Puisque nous savons que l'axe de l'avion a le même nombre de pixels que l'image, il ne devrait pas faire une différence ici. Mais si nous avons consulté les UV avion qui a réduit le nombre de pixels, alors qu'il serait essentiel d'utiliser CVPixelBufferGetHeightOfPlane.
- Cet article illustre ce genre de bug causes utilisation CVPixelBufferGetBaseAddress au lieu de CVPixelBufferGetBaseAddressOfPlane mkonrad.net/2014/06/24/...
- Pour planaires tampons, CVPixelBufferGetBaseAddress renvoie un pointeur sur une CVPlanarComponentInfo structure, ou NULL si aucune structure n'est présent. Donc, si votre tampon est planaire, vous devez utiliser CVPixelBufferGetBaseAddressOfPlane.
InformationsquelleAutor Codo

Si vous avez seulement besoin du canal de luminance, je vous déconseillons l'utilisation de BGRA format, car il est livré avec une conversion de frais généraux. Apple suggèrent d'utiliser BGRA si vous êtes en train de faire le rendu de choses, mais vous n'en avez pas besoin pour l'extraction de l'information de luminance. Comme Brad déjà mentionnés, le plus efficace est le format de la caméra natif format YUV.

Cependant, l'extraction de la droite octets dans le tampon d'échantillon est un peu délicat, notamment au sujet de l'iPhone 3G avec entrelacés YUV 422 format. Donc voici mon code, qui fonctionne très bien avec l'iPhone 3G, 3GS, iPod Touch 4 et iPhone 4S.

#pragma mark -
#pragma mark AVCaptureVideoDataOutputSampleBufferDelegate Methods
#if !(TARGET_IPHONE_SIMULATOR)
- (void)captureOutput:(AVCaptureOutput *)captureOutput didOutputSampleBuffer:(CMSampleBufferRef)sampleBuffer fromConnection:(AVCaptureConnection *)connection;
{
//get image buffer reference
CVImageBufferRef imageBuffer = CMSampleBufferGetImageBuffer(sampleBuffer);
//extract needed informations from image buffer
CVPixelBufferLockBaseAddress(imageBuffer, 0);
size_t bufferSize = CVPixelBufferGetDataSize(imageBuffer);
void *baseAddress = CVPixelBufferGetBaseAddress(imageBuffer);
CGSize resolution = CGSizeMake(CVPixelBufferGetWidth(imageBuffer), CVPixelBufferGetHeight(imageBuffer));
//variables for grayscaleBuffer 
void *grayscaleBuffer = 0;
size_t grayscaleBufferSize = 0;
//the pixelFormat differs between iPhone 3G and later models
OSType pixelFormat = CVPixelBufferGetPixelFormatType(imageBuffer);
if (pixelFormat == '2vuy') { //iPhone 3G
//kCVPixelFormatType_422YpCbCr8     = '2vuy',    
/* Component Y'CbCr 8-bit 4:2:2, ordered Cb Y'0 Cr Y'1 */
//copy every second byte (luminance bytes form Y-channel) to new buffer
grayscaleBufferSize = bufferSize/2;
grayscaleBuffer = malloc(grayscaleBufferSize);
if (grayscaleBuffer == NULL) {
NSLog(@"ERROR in %@:%@:%d: couldn't allocate memory for grayscaleBuffer!", NSStringFromClass([self class]), NSStringFromSelector(_cmd), __LINE__);
return nil; }
memset(grayscaleBuffer, 0, grayscaleBufferSize);
void *sourceMemPos = baseAddress + 1;
void *destinationMemPos = grayscaleBuffer;
void *destinationEnd = grayscaleBuffer + grayscaleBufferSize;
while (destinationMemPos <= destinationEnd) {
memcpy(destinationMemPos, sourceMemPos, 1);
destinationMemPos += 1;
sourceMemPos += 2;
}       
}
if (pixelFormat == '420v' || pixelFormat == '420f') {
//kCVPixelFormatType_420YpCbCr8BiPlanarVideoRange = '420v', 
//kCVPixelFormatType_420YpCbCr8BiPlanarFullRange  = '420f',
//Bi-Planar Component Y'CbCr 8-bit 4:2:0, video-range (luma=[16,235] chroma=[16,240]).  
//Bi-Planar Component Y'CbCr 8-bit 4:2:0, full-range (luma=[0,255] chroma=[1,255]).
//baseAddress points to a big-endian CVPlanarPixelBufferInfo_YCbCrBiPlanar struct
//i.e.: Y-channel in this format is in the first third of the buffer!
int bytesPerRow = CVPixelBufferGetBytesPerRowOfPlane(imageBuffer, 0);
baseAddress = CVPixelBufferGetBaseAddressOfPlane(imageBuffer,0);
grayscaleBufferSize = resolution.height * bytesPerRow ;
grayscaleBuffer = malloc(grayscaleBufferSize);
if (grayscaleBuffer == NULL) {
NSLog(@"ERROR in %@:%@:%d: couldn't allocate memory for grayscaleBuffer!", NSStringFromClass([self class]), NSStringFromSelector(_cmd), __LINE__);
return nil; }
memset(grayscaleBuffer, 0, grayscaleBufferSize);
memcpy (grayscaleBuffer, baseAddress, grayscaleBufferSize); 
}
//do whatever you want with the grayscale buffer
...
//clean-up
free(grayscaleBuffer);
}
#endif

Bonjour , merci pour la réponse , je suis confronté au même problème. Une seule chose est que je veux le Cr et Cb composants trop et je ne suis pas sûr de la façon de l'obtenir. Je suis en train de faire une peau détecteur et j'ai besoin de ces valeurs que j'ai trouvé ALORS dans un autre post. Je l'ai déjà fait à l'aide de BGRA format et conversion après que dans YCbCr mais je veux éviter que l'étape de conversion si possible afin d'augmenter les FPS. C'est pourquoi je souhaite obtenir l'individu Y, Cb et Cr de valeurs pour chaque pixel de l'image. Des idées?
Comment avez-vous trouver l'ordre des octets pour le composant de signal? Le document que j'ai trouvé à partir de Microsoft l'a classé comme Y0CrY1Cb.
J'ai trouvé un indice dans un Apple fichier d'en-tête. Je suis désolé, mais je ne peux pas vous en dire plus et fichier d'en-tête qu'il était.

InformationsquelleAutor Tafkadasoh

C'est tout simplement l'aboutissement de tout le monde au travail acharné, au-dessus et sur d'autres threads, converti à swift 3 pour toute personne qui le trouve utile.

func captureOutput(_ captureOutput: AVCaptureOutput!, didOutputSampleBuffer sampleBuffer: CMSampleBuffer!, from connection: AVCaptureConnection!) {
if let pixelBuffer = CMSampleBufferGetImageBuffer(sampleBuffer) {
CVPixelBufferLockBaseAddress(pixelBuffer, CVPixelBufferLockFlags.readOnly)
let pixelFormatType = CVPixelBufferGetPixelFormatType(pixelBuffer)
if pixelFormatType == kCVPixelFormatType_420YpCbCr8BiPlanarFullRange
|| pixelFormatType == kCVPixelFormatType_420YpCbCr8BiPlanarVideoRange {
let bufferHeight = CVPixelBufferGetHeight(pixelBuffer)
let bufferWidth = CVPixelBufferGetWidth(pixelBuffer)
let lumaBytesPerRow = CVPixelBufferGetBytesPerRowOfPlane(pixelBuffer, 0)
let size = bufferHeight * lumaBytesPerRow
let lumaBaseAddress = CVPixelBufferGetBaseAddressOfPlane(pixelBuffer, 0)
let lumaByteBuffer = unsafeBitCast(lumaBaseAddress, to:UnsafeMutablePointer<UInt8>.self)
let releaseDataCallback: CGDataProviderReleaseDataCallback = { (info: UnsafeMutableRawPointer?, data: UnsafeRawPointer, size: Int) -> () in
//https://developer.apple.com/reference/coregraphics/cgdataproviderreleasedatacallback
//N.B. 'CGDataProviderRelease' is unavailable: Core Foundation objects are automatically memory managed
return
}
if let dataProvider = CGDataProvider(dataInfo: nil, data: lumaByteBuffer, size: size, releaseData: releaseDataCallback) {
let colorSpace = CGColorSpaceCreateDeviceGray()
let bitmapInfo = CGBitmapInfo(rawValue: CGImageAlphaInfo.noneSkipFirst.rawValue)
let cgImage = CGImage(width: bufferWidth, height: bufferHeight, bitsPerComponent: 8, bitsPerPixel: 8, bytesPerRow: lumaBytesPerRow, space: colorSpace, bitmapInfo: bitmapInfo, provider: dataProvider, decode: nil, shouldInterpolate: false, intent: CGColorRenderingIntent.defaultIntent)
let greyscaleImage = UIImage(cgImage: cgImage!)
//do what you want with the greyscale image.
}
}
CVPixelBufferUnlockBaseAddress(pixelBuffer, CVPixelBufferLockFlags.readOnly)
}
}

InformationsquelleAutor Awesomeness

Vous devez vous connecter pour publier un commentaire.