La création de plis pour le k-fold CV dans R à l'aide de l'accent circonflexe
Je suis en train de faire un k-fold CV pour plusieurs méthodes de classification/hiperparameters en utilisant les données disponibles à
Ce set est composé de 208 lignes, chacune avec 60 attributs. Je suis en train de lire dans un ensemble de données.cadre à l'aide de la lecture.table de fonction.
La prochaine étape consiste à partager mes données en k plis, disons k = 5. Ma première tentative a été d'utiliser
test <- createFolds(t, k=5)
J'ai eu deux problèmes avec cette. La première est que la longueur des plis ne sont pas à côté les uns des autres:
Length Class Mode
Fold1 29 -aucun - numérique
Fold2 14 -aucun - numérique
Fold3 7 -aucun - numérique
Fold4 5 -aucun - numérique
Fold5 5 -aucun - numérique
L'autre, c'est que ce qui, apparemment, découpé mes données en fonction des attributs des indices, mais je veux diviser les données lui-même. J'ai pensé que par la transposition de mes données.cadre, à l'aide de:
test <- t(myDataNumericValues)
Mais quand je l'appelle la createFolds fonction, il me donne quelque chose comme ceci:
Length Class Mode
Fold1 2496 -aucun - numérique
Fold2 2496 -aucun - numérique
Fold3 2495 -aucun - numérique
Fold4 2496 -aucun - numérique
Fold5 2497 -aucun - numérique
La longueur problème a été résolu, mais c'est encore de ne pas fendre ma 208 données en conséquence.
Des idées sur ce que je peux faire? Pensez-vous que le signe du package n'est pas le plus approprié?
Merci d'avance
OriginalL'auteur gcolucci | 2014-04-07
Vous devez vous connecter pour publier un commentaire.
Veuillez lire
?createFolds
de comprendre ce que la fonction n'. Il crée les indices qui définissent les données sont tenu le séparer les plis (voir les options de retourner l'inverse):De les utiliser pour diviser les données:
La fonction
train
est utilisée dans ce package pour faire l'modélisation (vous n'avez généralement pas besoin de faire le fractionnement de vous-même. Voir cette page).Max
OriginalL'auteur topepo
Je ne suis pas familier avec le
caret
paquet, mais j'ai utilisé pour écrire une fonction calculant CV basé sur l'arbre de décision à partir de larpart
paquet. Bien sûr, la fonction a besoin de motifying afin de convenir à votre but.}
OriginalL'auteur Earo Wang