Série temporelle - division des données et évaluation du modèle

J'ai essayé d'utiliser l'apprentissage de la machine à faire des prédictions basées sur des données de séries chronologiques. Dans l'un des stackoverflow question (createTimeSlices fonction en SIGNE de package dans la R) est un exemple d'utilisation de createTimeSlices de la validation croisée pour le modèle de formation et de réglage des paramètres:

    library(caret)
    library(ggplot2)
    library(pls)
    data(economics)
    myTimeControl <- trainControl(method = "timeslice",
                                  initialWindow = 36,
                                  horizon = 12,
                                  fixedWindow = TRUE)

    plsFitTime <- train(unemploy ~ pce + pop + psavert,
                        data = economics,
                        method = "pls",
                        preProc = c("center", "scale"),
                        trControl = myTimeControl)

Ma compréhension est:

  1. J'ai besoin de partager des données d'entraînement et d'essai.
  2. De formation définies pour les paramètres de réglage.
  3. Évaluer modèle obtenu sur l'ensemble de test (à l'aide de R2 RMSE, etc.)

Parce que mes données est le temps de la série, je suppose que je ne peux pas utiliser ou initier de crève données dans la formation et l'ensemble de test. Donc, mes questions sont les suivantes: ai-je le droit? Et Si oui, - Comment utiliser createTimeSlices pour le modèle d'évaluation?

source d'informationauteur Jot eN