Quelle est la norme de Keras modèle de sortie moyenne? Qu'est-ce que l'époque et la perte de Keras?
J'ai juste construit mon premier modèle à l'aide de Keras et c'est la sortie. Il ressemble à la sortie standard, vous obtenez après la construction de n'importe quel Keras réseau de neurones artificiels. Même après avoir regardé dans la documentation, je n'ai pas bien comprendre ce que l'époque est et ce que la perte est ce qui est imprimé dans la sortie.
Ce qui est de l'époque et de la perte de Keras?
(Je sais que c'est probablement extrêmement simple question, mais je n'arrivais pas à localiser la réponse en ligne, et si la réponse est vraiment difficile de glaner de la documentation j'ai pensé que d'autres auraient la même question et a donc décidé de le poster ici.)
Epoch 1/20
1213/1213 [==============================] - 0s - loss: 0.1760
Epoch 2/20
1213/1213 [==============================] - 0s - loss: 0.1840
Epoch 3/20
1213/1213 [==============================] - 0s - loss: 0.1816
Epoch 4/20
1213/1213 [==============================] - 0s - loss: 0.1915
Epoch 5/20
1213/1213 [==============================] - 0s - loss: 0.1928
Epoch 6/20
1213/1213 [==============================] - 0s - loss: 0.1964
Epoch 7/20
1213/1213 [==============================] - 0s - loss: 0.1948
Epoch 8/20
1213/1213 [==============================] - 0s - loss: 0.1971
Epoch 9/20
1213/1213 [==============================] - 0s - loss: 0.1899
Epoch 10/20
1213/1213 [==============================] - 0s - loss: 0.1957
Epoch 11/20
1213/1213 [==============================] - 0s - loss: 0.1923
Epoch 12/20
1213/1213 [==============================] - 0s - loss: 0.1910
Epoch 13/20
1213/1213 [==============================] - 0s - loss: 0.2104
Epoch 14/20
1213/1213 [==============================] - 0s - loss: 0.1976
Epoch 15/20
1213/1213 [==============================] - 0s - loss: 0.1979
Epoch 16/20
1213/1213 [==============================] - 0s - loss: 0.2036
Epoch 17/20
1213/1213 [==============================] - 0s - loss: 0.2019
Epoch 18/20
1213/1213 [==============================] - 0s - loss: 0.1978
Epoch 19/20
1213/1213 [==============================] - 0s - loss: 0.1954
Epoch 20/20
1213/1213 [==============================] - 0s - loss: 0.1949
- L'époque est le nombre de passes sur les données. La perte est l'erreur sur l'ensemble de la formation généralement en termes d'erreur quadratique moyenne (pour la régression) ou journal de perte (pour le classement).
Vous devez vous connecter pour publier un commentaire.
Juste pour répondre à des questions plus spécifiquement, voici une définition de l'époque et de perte:
Époque: Un passage complet sur l'ensemble de votre formation de données.
Par exemple, à votre avis ci-dessus, vous avez 1213 observations. Donc, une époque se termine lorsque qu'il a terminé une formation de passer au-dessus de tous les 1213 de vos observations.
Perte: Une valeur scalaire que nous tentons de minimiser au cours de notre formation du modèle. Moins la perte, le plus proche de nos prévisions sont à la vraie étiquettes.
C'est généralement l'Erreur Quadratique Moyenne (MSE) comme David Maust dit ci-dessus, ou souvent dans Keras, Catégorique De La Croix De L'Entropie
Ce que vous attendez de la voir partir en cours d'exécution sur votre Keras modèle, est une diminution de la perte de plus de n nombre d'époques. Votre parcours de formation est plutôt anormal, que votre perte est en train d'augmenter. Cette pourrait être en raison d'un taux d'apprentissage qui est trop grand, ce qui provoque un dépassement de l'optima.
Comme jaycode mentionné précédemment, vous aurez envie de regarder votre performance du modèle sur invisible de données, comme c'est la cas d'utilisation de l'Apprentissage Machine.
En tant que tel, vous devez inclure une liste des mesures dans votre méthode de compilation, ce qui pourrait ressembler à:
Ainsi que l'exécution de votre modèle sur la validation lors de l'ajustement de la méthode, telle que:
Il y a beaucoup plus de choses à expliquer, mais j'espère que cela vous aide à commencer.
Une époque se termine lorsque votre modèle d'exécuter les données à travers tous les nœuds de votre réseau et prêt à mettre à jour les poids à atteindre optimale de perte de valeur. C'est petit, c'est mieux. Dans votre cas, comme il y a une augmentation de la perte des scores plus élevés de l'époque, il "semble" le modèle le mieux dans la première époque.
J'ai bien dit "semble", car nous ne pouvons pas dire pour sûr encore que le modèle n'a pas été testé en utilisant la bonne méthode de validation croisée c'est à dire qu'il n'est évalué qu'à l'encontre de ses données d'entraînement.
Façons d'améliorer votre modèle:
Combinant sklearn de GridSearchCV avec Keras pouvez automatiser ce processus.