Est-il une règle-de-pouce pour la façon de diviser un ensemble de données dans la formation et la validation des ensembles?

Est là une règle-de-pouce pour la façon de mieux diviser les données dans la formation et la validation des ensembles? Est encore divisée 50/50 conseillé? Ou il y a clairement des avantages d'avoir plus de données sur la formation relative à la validation des données (ou vice versa)? Ou est-ce un choix assez beaucoup dépend de l'application?

J'ai été la plupart du temps à l'aide d'un 80% /20% de la formation et de validation des données, respectivement, mais j'ai choisi cette division sans aucun fondée sur des principes de la raison. Quelqu'un peut-il qui est le plus expérimenté dans l'apprentissage de la machine me conseiller?

InformationsquelleAutor robguinness | 2012-11-28