la manipulation des caractères spéciaux par exemple, des accents de R
Je suis en train de faire sur le web scraping de noms dans un dataframe
Pour un nom tel que "Tomáš Rosický, j'obtiens un résultat "Tomáš Rosický"
J'ai essayé
Encoding("Tomáš Rosický") # with latin1 response
mais ne savait pas où aller à partir de là pour obtenir le nom d'origine, avec des accents de retour. Joué un peu avec iconv sans succès
Je serais satisfait (et peut-être même préférez) une sortie de "Tomas Rosicky"
Comment avez-vous de lire les données.cadre? Habituellement, vous pouvez fournir un paramètre d'encodage tels que
fileEncoding
à read.table
. Et comme @Hong Ooi répondu, UTF-8 semble être l'encodage que vous avez besoin.OriginalL'auteur pssguy | 2012-03-01
Vous devez vous connecter pour publier un commentaire.
Que vous avez lu dans une page encodée en UTF-8. si
x
est votre colonne de noms, utilisezEncoding(x) <- "UTF-8"
.OriginalL'auteur Hong Ooi
De faire une lecture correcte du fichier, utilisez la fonction scan:
Cela fonctionne aussi:
Cela va lire le fichier avec les bons accents
OriginalL'auteur Mischa Vreeburg
Un moyen d'exporter les accents correctement:
OriginalL'auteur iulilia
Vous devez utiliser ce:
OriginalL'auteur Roadkill