Pandas: Création d'une nouvelle trame de données à partir de seulement certaines colonnes
J'ai un fichier csv avec les mesures, et je veux créer un nouveau fichier csv avec les horaires des moyennes et des écarts-types. Mais seulement pour certaines colonnes.
Exemple:
csv1:
YY-MO-DD HH-MI-SS_SSS | Acceleration | Lumx | Pressure
2015-12-07 20:51:06:608 | 22.7 | 32.3 | 10
2015-12-07 20:51:07:609 | 22.5 | 47.7 | 15
csv 2 (uniquement pour la pression et d'accélération:
YY-MO-DD HH-MI-SS_SSS | Acceleration avg | Pressure avg
2015-12-07 20:00:00:000 | 22.6 | 12.5
2015-12-07 21:00:00:000 | .... | ....
Maintenant, j'ai une idée (merci pour les gens sur ce site) sur la façon de calculer les moyennes - mais je vais avoir de la difficulté sur la création d'un petit nouveau dataframe qui contient les calculs pour un peu de colonnes.
Merci !!!
Vous devez vous connecter pour publier un commentaire.
Vous devriez faire de plus petits df comme ci-dessous,
et peut gérer la csv2. (Vous avez dit que vous avez une idée à propos de avg calcul)
Pour info,
.copy()
pourrait être omis si vous êtes sûr de vue contre la copie.csv2=pd.DataFrame(); csv2['Acceleration Avg'] = csv1[['Acceleration', 'Pressure']].copy().apply(your_function)
et ainsi de suite..loc[]
permet de garder le subsetting fonctionnement explicites et cohérentes..loc[]
retourne toujours une copie pour l'original dataframe n'est jamais modifié.(pour plus de détails et de grands exemples des différents
view vs. copy
des solutions de rechange, veuillez consulter: Pandas: Savoir quand une opération affecte l'original dataframe)