Erreurs lors de l'exécution de Caret paquet dans la R

Je cherche à construire un modèle permettant de prédire si un produit ne se vendent sur un site de commerce électronique avec 1 ou 0 étant la sortie.

Mes données est une poignée de variables catégorielles, l'une avec un grand nombre de niveaux, un couple binaire, et un seul (le prix), avec une variable de sortie de 1 ou 0, si oui ou non la fiche produit a été vendue.

C'est mon code:

inTrainingset<-createDataPartition(C$Sale, p=.75, list=FALSE)
CTrain<-C[inTrainingset,]
CTest<-C[-inTrainingset,]


gbmfit<-gbm(Sale~., data=C,distribution="bernoulli",n.trees=5,interaction.depth=7,shrinkage=      .01,)
plot(gbmfit)


gbmTune<-train(Sale~.,data=CTrain, method="gbm")


ctrl<-trainControl(method="repeatedcv",repeats=5)
gbmTune<-train(Sale~.,data=CTrain, 
           method="gbm", 
           verbose=FALSE, 
           trControl=ctrl)


ctrl<-trainControl(method="repeatedcv", repeats=5, classProbs=TRUE, summaryFunction =    twoClassSummary)
gbmTune<-trainControl(Sale~., data=CTrain, 
                  method="gbm", 
                  metric="ROC", 
                  verbose=FALSE , 
                  trControl=ctrl)



  grid<-expand.grid(.interaction.depth=seq(1,7, by=2), .n.trees=seq(100,300, by=50),  .shrinkage=c(.01,.1))

  gbmTune<-train(Sale~., data=CTrain, 
           method="gbm", 
           metric="ROC", 
           tunegrid= grid, 
           verebose=FALSE,
           trControl=ctrl)



  set.seed(1)
  gbmTune <- train(Sale~., data = CTrain,
               method = "gbm",
               metric = "ROC",
               tuneGrid = grid,
               verbose = FALSE,
               trControl = ctrl)

Je suis en cours d'exécution en deux questions. La première est lorsque je tente d'ajouter le summaryFunction=twoClasssummary, puis réglez-je obtenir ceci:

Erreur dans trainControl(Vente ~ ., données = CTrain, method = "gbm", métrique = "ROC", :
inutilisés arguments (data = CTrain, métrique = "ROC", trControl = ctrl)

Le deuxième problème si je décide de contourner le summaryFunction, c'est quand j'essaie d'exécuter le modèle, j'obtiens cette erreur:

Erreur dans evalSummaryFunction(y, wts = poids, ctrl = trControl, lev = classLevels, :
train (le)'s l'utilisation de ROC codes exige de la classe des probabilités. Voir la classProbs option de trainControl()
En outre: le message d'Avertissement:
Dans le train.par défaut(x, y, poids = w, ...) :
ne peut pas calculer la classe de probabilités pour la régression

J'ai essayé de changer la variable de sortie à partir d'une valeur numérique de 1 ou de 0, pour une valeur de texte, dans excel, mais ce n'est pas faire une différence.

Toute aide serait grandement appréciée sur la façon de corriger le fait que c'est l'interprétation de ce modèle comme une régression, ou le premier message d'erreur je rencontre.

Mieux,

Va
[email protected]

S'il vous plaît consulter comment faire un exemple reproductible. Vous avez inclus un tas de code, mais pas de données de l'échantillon de sorte qu'on ne peut l'exécuter à reproduire la même erreur. Cela le rend beaucoup plus difficile pour vous aider.
Bon, je vais le faire! Merci
il est très proche de la reproductible si vous pouvez simplement utiliser l'une de la construit dans les ensembles de données, vérifiez que vos erreurs subsistent que des données, et laissez-nous savoir lequel utiliser. Vous pouvez exécuter data() pour voir les ensembles de données dans caret comme GermanCredit
Okay cool. Je vais courir avec la GermanCredit et essayer. Merci pour la considération.
cool! Je suis en train de faire la même chose. Par la manière, ce qui est gbm? Ce n'est pas de l'emballage caret. Mise à JOUR: ah, je vois que c'est à partir du package gbm et semble être dégradé stimuler

OriginalL'auteur Will Bunker | 2014-10-15