problème avec la spécification colClasses à lire.csv dans la R
Je suis en train de spécifier colClasses à lire.csv dans une tentative d'accélérer la vitesse de lecture de fichier csv. Cependant, je rencontre le problème suivant:
en supposant que j'ai un fichier appelé "t.csv":
"a","b"
"x","0"
Alors, si j'exécute les opérations suivantes dans R:
data <- read.csv('t.csv' , stringsAsFactors=FALSE, check.names=FALSE , comment.char='', colClasses= c('character','numeric') )
J'ai eu cette erreur:
Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
scan() expected 'a real', got '"0"'
Au début, je pensais que c'était le problème avec ma citation. Mais en utilisant quote='"' dans la lecture.csv n'a pas aidé.
Vous devez vous connecter pour publier un commentaire.
Votre deuxième colonne n'est pas
numeric
comme il est cité -- qui rend le texte.Afin de lire le texte, puis d'appeler
as.numeric(...)
sur la colonne. Ou modifier le fichier.Plus de Dirk,
Vous pouvez simplement déposer les colClasses argument et le fichier sera lu in fine.
Donne:
Vous devriez être en mesure de faire tout ce que vous voulez avec ce deuxième colonne.
GL
colClasses=c('character',NA)
qui causeread.csv
à utilisertype.convert
fonction de la deuxième colonne.