Importation de fichier CSV comme un DataFrame pandas
Quel est le Python pour lire dans un fichier CSV dans un les pandas DataFrame (ce que je peux ensuite utiliser pour des opérations statistiques, peuvent avoir différemment de type de colonnes, etc.)?
Mon fichier CSV "value.txt"
a le contenu suivant:
Date,"price","factor_1","factor_2"
2012-06-11,1600.20,1.255,1.548
2012-06-12,1610.02,1.258,1.554
2012-06-13,1618.07,1.249,1.552
2012-06-14,1624.40,1.253,1.556
2012-06-15,1626.15,1.258,1.552
2012-06-16,1626.15,1.263,1.558
2012-06-17,1626.15,1.264,1.572
Dans R nous lire ce fichier en utilisant:
price <- read.csv("value.txt")
et qui permettrait le retour d'une de la R de données.cadre:
> price <- read.csv("value.txt")
> price
Date price factor_1 factor_2
1 2012-06-11 1600.20 1.255 1.548
2 2012-06-12 1610.02 1.258 1.554
3 2012-06-13 1618.07 1.249 1.552
4 2012-06-14 1624.40 1.253 1.556
5 2012-06-15 1626.15 1.258 1.552
6 2012-06-16 1626.15 1.263 1.558
7 2012-06-17 1626.15 1.264 1.572
Est-il un Pythonic façon à obtenir la même fonctionnalité?
- vous féliciter sur ce qui est spécial avec est dataframe et ce que l'opération statistique pouvez-vous faire avec ça?
- dataframe est peut contenir plusieurs types de données , par exemple, chaque colonne peut être une liste , et vous pouvez traiter toutes les listes individuellement l'application de certaines fonctions sur eux , et sur le sujet des opérations statistiques , comme la moyenne , l'écart type , quartiles , ...
- Merci! C'est en fait très utile pour moi. J'ai toujours charger un fichier csv avec le csv module qui me donne une liste de listes. De ces données.cadre des sons de meilleure!
- voir mes modifications et le lien, lmk si que, de façon succincte, les réponses à vos questions. C'est autant que nous pouvons le faire ici pour "vendre" les avantages sociaux. L'ensemble de la question "Quels sont les avantages de l'utilisation d'une pandas dataframe sur la plaine de Python tableau/liste-des-liste?" a de nombreux avantages, beaucoup trop pour les énumérer ici...
Vous devez vous connecter pour publier un commentaire.
les pandas à la rescousse:
Cela renvoie pandas DataFrame qui est similaire à
R's
.Voici une alternative aux pandas de la bibliothèque à l'aide de Python intégré dans csv module.
imprime
Pour lire un fichier CSV comme les pandas DataFrame, vous aurez besoin d'utiliser
mp.read_csv
.Mais ce n'est pas là où l'histoire se termine; il existe des données dans de nombreux formats et est stockée dans des façons différentes de sorte que vous aurez souvent besoin de passer des paramètres supplémentaires pour
read_csv
pour assurer que vos données sont lues correctement.Voici un tableau listant les scénarios courants rencontrés avec les fichiers CSV avec les arguments que vous aurez besoin d'utiliser. Vous aurez généralement besoin de la totalité ou d'une combinaison des arguments ci-dessous pour lire dans votre de données.
Il y a d'autres arguments que je n'ai pas mentionné ici, mais ce sont ceux que vous rencontrerez le plus souvent.
index_col
: dites les pandas de la colonne(s) à utiliser comme index de votre dataframe'<sup>1</sup>
ne rend pas très bien, vous pouvez utiliser Unicode caractères en exposant ⁰123⁴⁵⁶⁷⁸⁹ , ou bien le repli[1], [2], ...
ou[a], [b], ...
Vous pouvez utiliser le csv module trouvé dans le python de la bibliothèque standard pour manipuler des fichiers CSV.
exemple:
csv
module est trop faible niveau.pandas
fournit le niveau demandé de l'abstraction.Remarque tout à fait propre, mais:
Pas aussi compact, mais il fait le travail: