Sens de l'Époque dans les Réseaux de Neurones de la Formation
alors que je suis en train de lire dans la façon de construire ANN dans pybrain, ils disent:
Former le réseau pour certaines époques. Habituellement, vous devez définir quelque chose
5 ici,trainer.trainEpochs( 1 )
J'ai cherché ce que c'est que dire , alors j'en conclus que nous utilisons une époque de données pour mettre à jour les poids, Si je choisis pour former les données avec 5 époques comme pybrain conseils, le jeu de données sera divisé en 5 sous-ensembles, et les revenants sera mise à jour 5 fois maximum.
Je suis familier avec la formation en ligne, où les revenants sont mis à jour après chaque échantillon de données ou de la fonction de vecteur, Ma question est de savoir comment être sûr que 5 époques seront suffisantes pour construire un modèle et le poids sans doute? quel est l'avantage de cette voie de formation en ligne? Aussi le terme "époque" est utilisé sur la formation en ligne, signifie-t-il une fonction vectorielle?
Vous devez vous connecter pour publier un commentaire.
Une époque se compose de un plein cycle de formation sur l'ensemble de la formation. Une fois que tous les échantillons dans le jeu est vu, vous commencez de nouveau - pour marquer le début de la 2e époque.
Cela n'a rien à voir avec de lot ou de formation en ligne en soi. Lot signifie que vous mettez à jour une fois à la fin de l'époque (après chaque échantillon est vu, c'est à dire #époque des mises à jour) et en ligne que vous mettez à jour après chaque échantillon (nombre d'échantillons * #époque des mises à jour).
Vous ne pouvez pas être sûr si 5 époques ou 500 est suffisante pour la convergence car elle varie à partir de données de données. Vous pouvez arrêter l'entraînement lorsque l'erreur converge ou devient inférieur à un certain seuil. Cela va aussi dans le territoire de la prévention de surapprentissage. Vous pouvez lire sur arrêt précoce et la validation croisée en la matière.
désolé pour la réactivation de ce fil.
im nouveau à des réseaux de neurones et im enquête sur l'impact de la " mini-lot de formation."
jusqu'à présent, ce que je comprends, une époque (comme runDOSrun est dire) est un moyen de l'utilisation de tous dans la TrainingSet (pas de jeu de données. parce que DataSet = TrainingSet + ValidationSet). en mini lot de la formation, vous pouvez sous-diviser la TrainingSet en petites Séries et mise à jour des poids à l'intérieur de l'époque. 'espérons," ce serait faire du réseau "convergent" le plus vite.
quelques définitions de réseaux de neurones sont dépassées et, je suppose, doit être redéfini.