Réseau de neurones LSTM d'entrée de forme à partir d'un dataframe

Je suis en train de mettre en œuvre un LSTM avec Keras.

Je sais que LSTM en Keras nécessitent une 3D tenseur de la forme de la (nb_samples, timesteps, input_dim) comme une entrée. Cependant, je ne suis pas entièrement sûr de savoir comment l'entrée devrait ressembler dans mon cas, comme je viens d'un échantillon de T observations pour chaque entrée, pas de multiples échantillons, c'est à dire (nb_samples=1, timesteps=T, input_dim=N). Est-il préférable de diviser chacune de mes entrées dans les échantillons de longueur T/M? T est autour de quelques millions d'observations pour moi, combien de temps doit chaque échantillon, dans ce cas, c'est à dire, comment pourrais-je choisir M?

Aussi, ai-je le droit, en ce que ce tenseur devrait ressembler à quelque chose comme:

[[[a_11, a_12, ..., a_1M], [a_21, a_22, ..., a_2M], ..., [a_N1, a_N2, ..., a_NM]], 
 [[b_11, b_12, ..., b_1M], [b_21, b_22, ..., b_2M], ..., [b_N1, b_N2, ..., b_NM]], 
 ..., 
 [[x_11, x_12, ..., a_1M], [x_21, x_22, ..., x_2M], ..., [x_N1, x_N2, ..., x_NM]]]

où M et N définis comme précédemment et x correspond à la dernière échantillon que j'aurais obtenu à partir de fractionnement comme indiqué ci-dessus?

Enfin, compte tenu d'une pandas dataframe avec T observations dans chaque colonne, et N colonnes, une pour chaque entrée, comment puis-je créer une entrée pour nourrir Keras?

  • Pourriez-vous ajouter un exemple de jeu de données pour vous remettre en question, s'il vous plaît? Parce qu'il n'est pas clair quel est l'enchaînement des entrées de créer ce genre de sortie cible dans votre modèle.
  • Pouvez-vous expliquer ce qu'est le format ou le type de données pour une observation? Est-il une valeur numérique unique, un ensemble de valeurs, ou quelque chose d'autre?
InformationsquelleAutor dreamer | 2016-09-24