L'importation de fichiers Excel dans R, ou xls xlsx
Svp quelqu'un peut m'aider sur la meilleure façon d'importer un fichier excel 2007 (.xlsx) fichier dans R. j'ai essayé plusieurs méthodes et aucun ne semble fonctionner. J'ai mis à jour à 2.13.1, windows XP, xlsx 0.3.0, je ne sais pas pourquoi le message d'erreur revient sans cesse. J'ai essayé:
AB<-read.xlsx("C:/AB_DNA_Tag_Numbers.xlsx","DNA_Tag_Numbers")
OU
AB<-read.xlsx("C:/AB_DNA_Tag_Numbers.xlsx",1)
mais j'obtiens l'erreur:
Error in .jnew("java/io/FileInputStream", file) :
java.io.FileNotFoundException: C:\AB_DNA_Tag_Numbers.xlsx (The system cannot find the file specified)
Merci.
- Combien de fois faites-vous cela? Si juste une fois, il est presque toujours préférable d'utiliser Excel pour l'exportation d'un plus format ouvert, comme
.csv
. - gsk3: Oui, ou Google Docs, qui a eu Excel 2007 soutien d'importation depuis '09: google.com/support/forum/p/Google%20Docs/... (j'espère que maintenant il fonctionne bien.)
- Quelle est la version de R est-ce? Ce système d'exploitation? Quelle est la version de read.xlsx? Avez-vous lu la publication du guide? </ripleybot>
- Pouvez-vous expliquer comment cette question est différente de stackoverflow.com/questions/6099243/...
- J'ai mis à jour à 2.13.1, windows XP, xlsx 0.3.0, je ne sais pas pourquoi le message d'erreur revient sans cesse..... Erreur dans .jnew("java/io/FileInputStream", fichier) : java.io.FileNotFoundException: C:\AB_DNA_Tag_Numbers.xlsx (Le système ne peut pas trouver le fichier spécifié)
- Je suppose que la principale différence est que l'OP veut lire .fichiers xlsx, le nouveau format utilisé par MS Excel.
- Vous avez vérifié que R est en fait capable de trouver le fichier, par exemple
file.exists("C:/AB_DNA_Tag_Numbers.xlsx")
?
Vous devez vous connecter pour publier un commentaire.
Pour une solution qui est gratuite délicats dépendances externes*, il est maintenant
readxl
:Il peut être installé comme suit:
ou
Utilisation
* pas strictement vrai, elle exige de la
Rcpp
le paquet, qui à son tour nécessite Rtools (pour Windows) ou Xcode (pour OSX), qui sont des dépendances externes à R. Mais ils n'ont pas besoin de tout tripoter les chemins, etc., donc, c'est un avantage par rapport à Java et Perl dépendances.Mise à jour Il est maintenant le rexcel paquet. Cela promet d'obtenir Excel mise en forme, les fonctions et de nombreux autres types d'informations à partir du fichier Excel et en R.
Vous pouvez également essayer de le XLConnect paquet. J'ai eu plus de chance avec elle que xlsx (de plus, il peut lire .les fichiers xls trop).
aussi, si vous rencontrez des problèmes avec votre fichier n'est pas trouvé, essayez de le sélectionner avec fichier.sélectionnez().
readWorksheet(loadWorkbook(...))
vous pouvez faire la même chose un peu plus succinctement avecreadWorksheetFromFile(...)
.Je voudrais certainement essayer la
read.xls
fonction dans legdata
paquet, qui est beaucoup plus mature que lesxlsx
paquet. Il peut exiger Perl ...Mise à jour
Que la Réponse ci-dessous est aujourd'hui quelque peu dépassée, je voudrais simplement attirer l'attention sur le readxl paquet. Si la feuille Excel est bien formaté/lain alors, j'aimerais maintenant utiliser readxl à lire à partir du classeur. Si les feuilles sont mal mis en forme/gît alors je serais encore les exporter au format CSV et de gérer les problèmes de la R soit par l'intermédiaire de
read.csv()
ou tout simplement l'readLines()
.D'origine
Mon manière préférée est à enregistrer que des feuilles de calcul Excel en valeurs séparées par des virgules (CSV) des fichiers. Sur Windows, ces fichiers sont associés avec Excel afin de ne pas perdre le double-clic-ouvert-dans-Excel "fonctionnalité".
Les fichiers CSV peuvent être lus dans R à l'aide de
read.csv()
, ou, si vous êtes dans un endroit ou à l'aide d'un ordinateur mis en place avec certains paramètres (où,
est utilisé comme la virgule), à l'aide deread.csv2()
.Ces fonctions ont des valeurs par défaut raisonnables qui rend la lecture le bon format de fichiers simple. Il suffit de garder toutes les étiquettes pour les échantillons ou les variables dans la première ligne ou colonne.
Ajouté avantages de stocker des fichiers au format CSV que, tant que les fichiers texte en clair, ils peuvent être passés très facilement et vous pouvez être certain qu'ils vont ouvrir n'importe où; l'on n'a pas besoin d'Excel pour consulter ou modifier les données.
read.xlsx()
et les dernières versions de ce package et R, puis l'envoyer par courriel le responsable du paquet pour signaler un bug potentiel.Exemple 2012:
Exemple 2015:
readxl
et ont fait une bonne expérience avec elle.Ce nouveau paquet a l'air sympa http://cran.r-project.org/web/packages/openxlsx/openxlsx.pdf
Il ne nécessite pas rJava et est à l'aide de 'Rcpp' pour la vitesse.
Si vous rencontrez le même problème et R est de vous donner une erreur -- ne pouvait pas trouver de fonction ".jnew" -- il suffit d'installer la bibliothèque rJava. Ou si vous l'avez déjà, il suffit d'exécuter la ligne de la bibliothèque(rJava). Que devrait être le problème.
Aussi, il devrait être clair pour tout le monde que csv et txt sont plus faciles à travailler avec, mais la vie n'est pas facile et parfois vous avez juste à ouvrir un xlsx.
gdata
j'obtiens le message de démarragegdata: read.xls support for 'XLSX' (Excel 2007+) files ENABLED.
Sonne pour moi comme il se doit ouvrir les fichiers xlsx, bien que, certes, je n'ai pas testé récemment ...gdata
version 2.8.2 litxlsx
les fichiers avec l'read.xls
fonction.J'ai récemment découvert Schaun Wheeler fonction d'importation de fichiers excel dans R après la réalisation, que le xlxs colis n'avait pas été mis à jour pour la R 3.1.0.
https://gist.github.com/schaunwheeler/5825002
Le nom de fichier doit avoir l' ".xlsx" et de l'extension de fichier ne peut pas être ouvert lorsque vous exécutez la fonction.
Cette fonction est très utile pour accéder à d'autres peuples de travail. Les principaux avantages par rapport à la lire.csv fonction sont quand
À l'aide de la lecture.csv fonction nécessite manuel de l'ouverture et de l'enregistrement de chaque document Excel qui est fastidieux et très ennuyeux. À l'aide de Schaun fonction d'automatiser le flux de travail est donc une aide massive.
Un grand respect à Schaun pour cette solution.
Pour moi le openxlx paquet travaillé dans la manière la plus simple.
Quel est ton système d'exploitation? Quelle est la version de R êtes-vous en cours d'exécution: 32 bits ou 64 bits? Quelle est la version de Java que vous avez installé?
J'ai eu une erreur similaire lorsque j'ai commencé à utiliser le
read.xlsx()
fonction et découvert que mon problème (qui peut ou peut ne pas être liée à la vôtre; au minimum, cette réponse doit être considérée comme "essayer cette, trop") était liée à la incompatability de .xlsx paquet avec la version 64 bits de Java. Je suis assez certain que l' .xlsx package requiert 32 bits de Java.Utiliser 32 bits R et assurez-vous que la version 32 bits de Java est installé. Cela peut résoudre votre problème.
Commentaire ci-dessus devraient ai résolu votre problème:
devrait fonctionner correctement après.
Vous pourriez être en mesure de conserver plusieurs onglets et de mise en forme plus d'informations si vous les exporter vers une feuille de calcul OpenDocument fichier (ods) ou un ancien format Excel et de les importer avec la ODS lecteur ou Excel reader que vous avez mentionné ci-dessus.
Comme indiqué par beaucoup ici, je suis en train d'écrire la même chose, mais avec un point supplémentaire!
Au premier abord, nous devons nous assurer que nos R Studio a ces deux paquets installés:
Afin de charger un package dans R, vous pouvez utiliser la sous fonction:
recherche affiche la liste des paquets disponibles dans votre R Studio.
Maintenant un autre attraper, même si vous pourriez avoir ces deux paquets, mais encore, vous pouvez rencontrer de problème lors de la lecture de "xlsx" fichier et l'erreur peut être comme "erreur: plus de colonnes que le nom de la colonne"
Pour résoudre ce problème, vous pouvez simplement enregistrer à nouveau votre feuille excel "xlsx" à
et votre vie va être super facile....
Amusez-vous!!
J'ai essayé très dur sur toutes les réponses ci-dessus. Cependant, ils n'ont pas réellement de l'aide, car j'ai utilisé un mac. Le rio bibliothèque a cette fonction d'importation qui peut, en gros, importation de tout type de fichier de données dans Rstudio, même ceux de fichier en utilisant d'autres langues que l'anglais!
Essayer les codes ci-dessous:
Espérons que cette aide.
Pour plus de détails référence: https://cran.r-project.org/web/packages/rio/vignettes/rio.html