Comment voulez-vous faire TensorFlow + Keras rapide avec un TFRecord dataset?

Ce qui est un exemple de comment utiliser un TensorFlow TFRecord avec un Keras Modèle et de la tf.session.run() tout en gardant la base de données dans tenseurs w/file d'attente des coureurs?

Ci-dessous est un extrait de code qui fonctionne mais il faut les améliorations suivantes:

Utiliser le Le modèle de l'API
spécifier une Entrée()
Charger un jeu de données à partir d'un TFRecord
Courir à travers un jeu de données en parallèle (comme avec un queuerunner)

Voici l'extrait de code, il y a plusieurs TODO lignes indiquant ce qui est nécessaire:

from keras.models import Model
import tensorflow as tf
from keras import backend as K
from keras.layers import Dense, Input
from keras.objectives import categorical_crossentropy
from tensorflow.examples.tutorials.mnist import input_data

sess = tf.Session()
K.set_session(sess)

# Can this be done more efficiently than placeholders w/TFRecords?
img = tf.placeholder(tf.float32, shape=(None, 784))
labels = tf.placeholder(tf.float32, shape=(None, 10))

# TODO: Use Input() 
x = Dense(128, activation='relu')(img)
x = Dense(128, activation='relu')(x)
preds = Dense(10, activation='softmax')(x)
# TODO: Construct model = Model(input=inputs, output=preds)

loss = tf.reduce_mean(categorical_crossentropy(labels, preds))

# TODO: handle TFRecord data, is it the same?
mnist_data = input_data.read_data_sets('MNIST_data', one_hot=True)

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(loss)

sess.run(tf.global_variables_initializer())

# TODO remove default, add queuerunner
with sess.as_default():
    for i in range(1000):
        batch = mnist_data.train.next_batch(50)
        train_step.run(feed_dict={img: batch[0],
                                  labels: batch[1]})
    print(loss.eval(feed_dict={img:    mnist_data.test.images, 
                               labels: mnist_data.test.labels}))

Pourquoi cette question est-elle pertinente?

Pour entraînement de haute performance sans revenir à python
- pas TFRecord de numpy à tenseur des conversions
Keras feront bientôt partie de tensorflow
Démontrer comment Keras (Modèle) classes peuvent accepter des tenseurs pour les données d'entrée correctement.

Voici quelques démarreur pour une sémantique problème de segmentation exemple:

exemple unet Keras modèle unet.py, il arrive à être pour la sémantique de la segmentation.
Keras + Tensorflow Post De Blog
Un tentative à l'exécution de l'unet un modèle tf session avec TFRecords et Keras modèle (pas de travail)
Code pour créer le TFRecords: tf_records.py
Une tentative d'exécution de l'unet un modèle tf session avec TFRecords et Keras modèle est en densenet_fcn.py (pas de travail)

github.com/tensorflow/tensorflow/issues/8787 sera pour le travail vers le support de cette fonctionnalité au-delà de la solution fournie dans la accepté de répondre.
mise à jour de pull request github.com/fchollet/keras/pull/6928

InformationsquelleAutor Andrew Hundt | 2017-02-12

24

Je n'utilise pas tfrecord dataset format afin de ne pas argumenter sur les avantages et les inconvénients, mais je me suis intéressé à l'extension de Keras à l'appui de la même chose.

github.com/indraforyou/keras_tfrecord est le référentiel. Va vous expliquer brièvement les principaux changements.

Dataset création et chargement

data_to_tfrecord et read_and_decode ici prend soin de créer tfrecord jeu de données et le chargement de la même. Une attention particulière doit être pour mettre en œuvre les read_and_decode sinon vous ferez face à cryptique des erreurs au cours de la formation.

Initialisation et Keras modèle

Maintenant deux tf.train.shuffle_batch et Keras Input couche retourne tenseur. Mais celui retourné par tf.train.shuffle_batch n'ont pas de métadonnées requises par Keras en interne. Comme il s'avère, tout tenseur peut être facilement transformé en un tenseur avec keras métadonnées en appelant Input couche avec tensor param.

Donc cela prend en charge l'initialisation:
```
x_train_, y_train_ = ktfr.read_and_decode('train.mnist.tfrecord', one_hot=True, n_class=nb_classes, is_train=True)

x_train_batch, y_train_batch = K.tf.train.shuffle_batch([x_train_, y_train_],
                                                batch_size=batch_size,
                                                capacity=2000,
                                                min_after_dequeue=1000,
                                                num_threads=32) # set the number of threads here

x_train_inp = Input(tensor=x_train_batch)
```
Maintenant avec x_train_inp tout keras modèle peut être développé.

De formation (simple)

Permet de dire train_out est la sortie du tenseur de votre keras modèle. Vous pouvez facilement écrire une formation personnalisée boucle sur les lignes de:
```
loss = tf.reduce_mean(categorical_crossentropy(y_train_batch, train_out))
train_op = tf.train.GradientDescentOptimizer(0.01).minimize(loss)


# sess.run(tf.global_variables_initializer())
sess.run(tf.initialize_all_variables())

with sess.as_default():
    coord = tf.train.Coordinator()
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)

    try:
      step = 0
      while not coord.should_stop():
        start_time = time.time()

        _, loss_value = sess.run([train_op, loss], feed_dict={K.learning_phase(): 0})

        duration = time.time() - start_time

        if step % 100 == 0:
          print('Step %d: loss = %.2f (%.3f sec)' % (step, loss_value,
                                                     duration))
        step += 1
    except tf.errors.OutOfRangeError:
      print('Done training for %d epochs, %d steps.' % (FLAGS.num_epochs, step))
    finally:
      coord.request_stop()

    coord.join(threads)
    sess.close()
```
De formation (keras style)

Une des caractéristiques de keras qui le rend si lucrative est son généralisée mécanisme de formation avec les fonctions de rappel.

Mais à l'appui de tfrecords type de formation il y a plusieurs changements qui sont nécessaires dans le fit fonction
- l'exécution de la file d'attente des threads
- pas d'alimentation dans le lot de données par le biais de feed_dict
- l'appui de validation devient difficile, car les données de validation, seront également venir à travers un autre tenseur un autre modèle doit être créées en interne avec un partage des couches supérieures et la validation du tenseur nourris par d'autres tfrecord lecteur.
Mais tout cela peut être facilement pris en charge par un autre paramètre flag. Ce qui rend les choses déconner sont les keras caractéristiques sample_weight et class_weight ils sont utilisés pour peser chaque échantillon et de peser chaque classe. Pour cela, dans compile() keras crée des espaces réservés (ici) et les espaces réservés sont également implicitement créé pour les cibles (ici) qui n'est pas nécessaire dans notre cas, les étiquettes sont déjà nourris par tfrecord lecteurs. Ces espaces réservés besoin d'être nourris en cours de session qui est inutile dans notre cae.

Donc prendre en compte ces modifications, compile_tfrecord(ici) et fit_tfrecord(ici) sont l'extension de compile et fit et actions à dire 95% du code.

Ils peuvent être utilisés de la façon suivante:
```
import keras_tfrecord as ktfr

train_model = Model(input=x_train_inp, output=train_out)
ktfr.compile_tfrecord(train_model, optimizer='rmsprop', loss='categorical_crossentropy', out_tensor_lst=[y_train_batch], metrics=['accuracy'])

train_model.summary()

ktfr.fit_tfrecord(train_model, X_train.shape[0], batch_size, nb_epoch=3)
train_model.save_weights('saved_wt.h5')
```
Vous êtes les bienvenus pour améliorer le code et pull requests.
- wow a l'air fantastique! Peut-être la peine d'une pull request sur keras-contrib, le fonctionnaire keras en amont référentiel? Je vais essayer ça alors, j'imagine que je vais le prix de la réponse de crédit + bounty. J'ai aussi modifié les liens pour utiliser la version actuelle de hachage de keras de sorte que la ligne de numéros de rester correct.
- voici le keras-contrib pull request #27
InformationsquelleAutor indraforyou

Mise à jour 2018-08-29 c'est maintenant pris en charge directement dans keras, voir l'exemple suivant:

https://github.com/keras-team/keras/blob/master/examples/mnist_tfrecord.py

Réponse Originale À Cette Question:

TFRecords sont pris en charge par l'aide d'une perte. Voici les principales lignes de la construction d'un externe de perte:

# tf yield ops that supply dataset images and labels
x_train_batch, y_train_batch = read_and_decode_recordinput(...)

# create a basic cnn
x_train_input = Input(tensor=x_train_batch)
x_train_out = cnn_layers(x_train_input)

model = Model(inputs=x_train_input, outputs=x_train_out)
loss = keras.losses.categorical_crossentropy(y_train_batch, x_train_out)
model.add_loss(loss)

model.compile(optimizer='rmsprop', loss=None)

Voici un exemple pour Keras 2. Il fonctionne après l'application du patch petit #7060:

'''MNIST dataset with TensorFlow TFRecords.
Gets to 99.25% test accuracy after 12 epochs
(there is still a lot of margin for parameter tuning).
'''
import os
import copy
import time
import numpy as np
import tensorflow as tf
from tensorflow.python.ops import data_flow_ops
from keras import backend as K
from keras.models import Model
from keras.layers import Dense
from keras.layers import Dropout
from keras.layers import Flatten
from keras.layers import Input
from keras.layers import Conv2D
from keras.layers import MaxPooling2D
from keras.callbacks import EarlyStopping
from keras.callbacks import TensorBoard
from keras.objectives import categorical_crossentropy
from keras.utils import np_utils
from keras.utils.generic_utils import Progbar
from keras import callbacks as cbks
from keras import optimizers, objectives
from keras import metrics as metrics_module
from keras.datasets import mnist
if K.backend() != 'tensorflow':
raise RuntimeError('This example can only run with the '
'TensorFlow backend for the time being, '
'because it requires TFRecords, which '
'are not supported on other platforms.')
def images_to_tfrecord(images, labels, filename):
def _int64_feature(value):
return tf.train.Feature(int64_list=tf.train.Int64List(value=[value]))
def _bytes_feature(value):
return tf.train.Feature(bytes_list=tf.train.BytesList(value=[value]))
""" Save data into TFRecord """
if not os.path.isfile(filename):
num_examples = images.shape[0]
rows = images.shape[1]
cols = images.shape[2]
depth = images.shape[3]
print('Writing', filename)
writer = tf.python_io.TFRecordWriter(filename)
for index in range(num_examples):
image_raw = images[index].tostring()
example = tf.train.Example(features=tf.train.Features(feature={
'height': _int64_feature(rows),
'width': _int64_feature(cols),
'depth': _int64_feature(depth),
'label': _int64_feature(int(labels[index])),
'image_raw': _bytes_feature(image_raw)}))
writer.write(example.SerializeToString())
writer.close()
else:
print('tfrecord %s already exists' % filename)
def read_and_decode_recordinput(tf_glob, one_hot=True, classes=None, is_train=None,
batch_shape=[1000, 28, 28, 1], parallelism=1):
""" Return tensor to read from TFRecord """
print 'Creating graph for loading %s TFRecords...' % tf_glob
with tf.variable_scope("TFRecords"):
record_input = data_flow_ops.RecordInput(
tf_glob, batch_size=batch_shape[0], parallelism=parallelism)
records_op = record_input.get_yield_op()
records_op = tf.split(records_op, batch_shape[0], 0)
records_op = [tf.reshape(record, []) for record in records_op]
progbar = Progbar(len(records_op))
images = []
labels = []
for i, serialized_example in enumerate(records_op):
progbar.update(i)
with tf.variable_scope("parse_images", reuse=True):
features = tf.parse_single_example(
serialized_example,
features={
'label': tf.FixedLenFeature([], tf.int64),
'image_raw': tf.FixedLenFeature([], tf.string),
})
img = tf.decode_raw(features['image_raw'], tf.uint8)
img.set_shape(batch_shape[1] * batch_shape[2])
img = tf.reshape(img, [1] + batch_shape[1:])
img = tf.cast(img, tf.float32) * (1. / 255) - 0.5
label = tf.cast(features['label'], tf.int32)
if one_hot and classes:
label = tf.one_hot(label, classes)
images.append(img)
labels.append(label)
images = tf.parallel_stack(images, 0)
labels = tf.parallel_stack(labels, 0)
images = tf.cast(images, tf.float32)
images = tf.reshape(images, shape=batch_shape)
# StagingArea will store tensors
# across multiple steps to
# speed up execution
images_shape = images.get_shape()
labels_shape = labels.get_shape()
copy_stage = data_flow_ops.StagingArea(
[tf.float32, tf.float32],
shapes=[images_shape, labels_shape])
copy_stage_op = copy_stage.put(
[images, labels])
staged_images, staged_labels = copy_stage.get()
return images, labels
def save_mnist_as_tfrecord():
(X_train, y_train), (X_test, y_test) = mnist.load_data()
X_train = X_train[..., np.newaxis]
X_test = X_test[..., np.newaxis]
images_to_tfrecord(images=X_train, labels=y_train, filename='train.mnist.tfrecord')
images_to_tfrecord(images=X_test, labels=y_test, filename='test.mnist.tfrecord')
def cnn_layers(x_train_input):
x = Conv2D(32, (3, 3), activation='relu', padding='valid')(x_train_input)
x = Conv2D(64, (3, 3), activation='relu')(x)
x = MaxPooling2D(pool_size=(2, 2))(x)
x = Dropout(0.25)(x)
x = Flatten()(x)
x = Dense(128, activation='relu')(x)
x = Dropout(0.5)(x)
x_train_out = Dense(classes,
activation='softmax',
name='x_train_out')(x)
return x_train_out
sess = tf.Session()
K.set_session(sess)
save_mnist_as_tfrecord()
batch_size = 100
batch_shape = [batch_size, 28, 28, 1]
epochs = 3000
classes = 10
parallelism = 10
x_train_batch, y_train_batch = read_and_decode_recordinput(
'train.mnist.tfrecord',
one_hot=True,
classes=classes,
is_train=True,
batch_shape=batch_shape,
parallelism=parallelism)
x_test_batch, y_test_batch = read_and_decode_recordinput(
'test.mnist.tfrecord',
one_hot=True,
classes=classes,
is_train=True,
batch_shape=batch_shape,
parallelism=parallelism)
x_batch_shape = x_train_batch.get_shape().as_list()
y_batch_shape = y_train_batch.get_shape().as_list()
x_train_input = Input(tensor=x_train_batch, batch_shape=x_batch_shape)
x_train_out = cnn_layers(x_train_input)
y_train_in_out = Input(tensor=y_train_batch, batch_shape=y_batch_shape, name='y_labels')
cce = categorical_crossentropy(y_train_batch, x_train_out)
train_model = Model(inputs=[x_train_input], outputs=[x_train_out])
train_model.add_loss(cce)
train_model.compile(optimizer='rmsprop',
loss=None,
metrics=['accuracy'])
train_model.summary()
tensorboard = TensorBoard()
# tensorboard disabled due to Keras bug
train_model.fit(batch_size=batch_size,
epochs=epochs)  # callbacks=[tensorboard])
train_model.save_weights('saved_wt.h5')
K.clear_session()
# Second Session, pure Keras
(X_train, y_train), (X_test, y_test) = mnist.load_data()
X_train = X_train[..., np.newaxis]
X_test = X_test[..., np.newaxis]
x_test_inp = Input(batch_shape=(None,) + (X_test.shape[1:]))
test_out = cnn_layers(x_test_inp)
test_model = Model(inputs=x_test_inp, outputs=test_out)
test_model.load_weights('saved_wt.h5')
test_model.compile(optimizer='rmsprop', loss='categorical_crossentropy', metrics=['accuracy'])
test_model.summary()
loss, acc = test_model.evaluate(X_test, np_utils.to_categorical(y_test), classes)
print('\nTest accuracy: {0}'.format(acc))

J'ai aussi travaillé à améliorer le soutien aux TFRecords dans le numéro suivant, et tirez sur demande:

#6928 Rendement Op soutien de: la Haute Performance de vastes ensembles de données via TFRecords, et RecordInput
#7102 Keras Entrée du Tenseur de Conception d'API Proposition

Enfin, il est possible d'utiliser tf.contrib.learn.Experiment pour former Keras modèles dans TensorFlow.

Je n'ai pu obtenir cet exemple de travail avec l'extérieur de la perte après incorporation de PR github.com/fchollet/keras/pull/7060 pour résoudre le generic_utils.py le module.
Pour une raison quelconque, data_flow_ops.RecordInput retourne seulement le premier lot, puis Keras pense que cette époque est fait, et redémarrer une autre époque. Je ne peux pas comprendre pourquoi. Je sais que c'est dur pour vous de voir ce qui se passe, mais avez-vous des suggestions sur la façon de débogage? Merci beaucoup. Je suis sûr que tfrecord fichier que je passe est correct (avoir plus de 60k images).
Ce devrait être l'un des séparée, stackoverflow question. Avec le courant de keras maître à une seule étape == une époque, alors il suffit d'exécuter de façon répétée, ou essayer github.com/fchollet/keras/pull/7113.

InformationsquelleAutor Andrew Hundt

Vous devez vous connecter pour publier un commentaire.