la suppression des retours à la ligne à partir de désordre chaînes de caractères dans les pandas dataframe cellules?
J'ai utilisé de multiples façons de diviser et de les dépouiller les chaînes dans mes pandas dataframe de supprimer tous les '\n'characters, mais pour quelque raison il ne veut simplement pas supprimer les caractères qui sont attachés à d'autres mots, même si je les diviser. J'ai une pandas dataframe avec une colonne qui capture de texte à partir de pages web à l'aide de Beautifulsoup. Le texte a été nettoyée déjà un peu par beautifulsoup, mais il a échoué à supprimer les retours à la ligne joint à d'autres personnages. Mes chaînes ressemble un peu à ceci:
"à la main\ndevelopment de jeux. Nous allons étudier une variété de logiciels de technologies de l'\nrelevant de jeux, y compris les langages de programmation, scripts\nlanguages, systèmes d'exploitation, systèmes de fichiers, les réseaux, la simulation\nengines, le multimédia et la conception de systèmes. Nous allons également étudier certaines de\nl'concepts scientifiques sous-jacents à partir de l'ordinateur de la science et des\nfields y compris"
Est facile python moyen de supprimer ces "\n" caractères?
Merci d'avance!
OriginalL'auteur Calvin | 2017-05-28
Vous devez vous connecter pour publier un commentaire.
EDIT: la bonne réponse à cette question est:
Je pense que vous avez besoin
remplacer
:Ou:
Ou:
Exemple:
Je pense que cette tâche sont données dépendantes et sont vraiment dur (si le simple fait de remplacer doesnt work). Est donc possible de créer pickle et de l'envoyer à mon email dans mon profil? Si les données sont confidental, il est possible d'anonymiser?
Il a été envoyé!
OriginalL'auteur jezrael
dans le désordre de données, il pourrait être une bonne idée de supprimer tous les espaces
df.replace(r'\s', '', regex = True, inplace = True)
.OriginalL'auteur Pawel Piela