l'analyse des documents excel avec python
Je veux analyser le document excel pour les listes en Python.
Est-il une bibliothèque python qui est utile pour cette action?
Et quelles sont les fonctions de la bibliothèque?
- pouvez-vous exporter le fichier Excel au format csv?
- double possible de Comment puis-je ouvrir un fichier Excel en Python?
Vous devez vous connecter pour publier un commentaire.
Vous êtes le meilleur pari pour l'analyse des fichiers Excel serait le xlrd de la bibliothèque. Le python-excel.org site a des liens et des exemples pour xlrd et liées python excel bibliothèques, y compris un document pdf qui a quelques bons exemples de l'utilisation de xlrd. Bien sûr, il ya aussi beaucoup de liées xlrd questions sur StackOverflow qui pourrait être utile.
Une mise en garde avec le xlrd bibliothèque, c'est qu'il ne fonctionne qu'avecxls
(Excel 2003 et les versions antérieures d'excel) formats de fichier et pas la plus récentexlsx
format de fichier. Il s'agit d'une nouvelle bibliothèque openpyxl pour traiter laxlsx
, mais je ne l'ai jamais utilisé.Mise à JOUR:
Selon Jean de commentaire, le xlrd bibliothèque prend désormais en charge les
xls
etxlsx
les formats de fichiers.Espère que ça aide.
xlrd
lit maintenant les deux à la fois .xlsx et .les fichiers xls.La les pandas de la bibliothèque est un moyen facile et rapide de lire excel. Si c'est surtout des données et rien de trop compliqué, il va travailler:
Il lit dans un les pandas DataFrame, ce qui est pratique pour les données munging, etc.
Pour accéder à une liste:
Si vous avez plusieurs tables et des choses dans chaque feuille de calcul, vous pouvez utiliser une autre bibliothèque comme xlrd ou openpyxl.
openpyxl est une grande bibliothèque et supporte la lecture/écriture à 2010 fichiers xlsx.
exemple de code d'analyse
de l'échantillon de l'écriture de code
vous pouvez en lire plus ici: https://openpyxl.readthedocs.io/en/stable/index.html
xlrd est idéal pour les tâches simples, mais si vous avez besoin de travailler avec l'un de Excel plus profonds de la fonctionnalité (des macros, des avancées de traçage, etc), et vous travaillez sur une machine windows, vous pouvez utiliser le pywin32 bibliothèque pour le contrôle de la win32com couche. Elle permet d'accéder à peu près tout ce qui peut être contrôlé via des macros /Visual Basic.
Si vous souhaitez analyser
xlsx
essayer python-format xlsxpyExcelerator ne semble pas être plus maintenue, mais je l'ai utilisé pendant un certain temps et l'aime vraiment.
Points Clés:
Mise à jour
Tous mes nouveaux projets ont déménagé à xlrd.
xlrd
.