Comment puis-je supprimer tous les caractères non-ASCII avec la regex et Notepad++?
J'ai beaucoup cherché, mais nulle part il n'est écrit comment faire pour supprimer les caractères non-ASCII à partir de Notepad++.
J'ai besoin de savoir quelle commande à écrire dans rechercher et remplacer (avec une photo ce serait génial).
-
Si je veux faire une liste blanche et de marque tous les ASCII mots/lignes non-ASCII lignes serait banalisée
-
Si le fichier est assez gros et ne pouvez pas sélectionner tous les ASCII lignes et voulez juste de sélectionner les lignes contenant des caractères non-ASCII...
Vous devez vous connecter pour publier un commentaire.
Cette expression de recherche pour les non-valeurs ASCII:
Tick off "Mode de Recherche = expression Régulière', et cliquez sur Suivant.
Source: Regex n'importe quel caractère ASCII
Encoding->Encode in ANSI
. A été incapable de trouver quoi que ce soit autrement.Dans Notepad++, si vous allez dans le menu de Recherche → des personnages dans la gamme → Caractères Non-ASCII (de 128 à 255) vous pouvez ensuite étape à travers le document à chacun des caractères non-ASCII.
En plus de la réponse par ProGM, dans le cas où vous voyez des caractères dans des boîtes comme NUL ou accusé de réception et que vous voulez vous débarrasser d'eux, ceux qui sont des caractères de contrôle ASCII (0 à 31), vous pouvez les trouver avec l'expression suivante et de les supprimer:
Afin d'éliminer tous les non-ASCII ET ASCII des caractères de contrôle, vous devez supprimer tous les caractères correspondant à cette regex:
\x00
et\x1F
sont déjà appariés dans la réponse ProGM.Pour supprimer tous les caractères non-ASCII, vous pouvez utiliser de remplacement suivants:
[^\x00-\x7F]+
Pour mettre en surbrillance les caractères, je recommande d'utiliser le Marque fonction dans la fenêtre de recherche: cela met en évidence les caractères non-ASCII et de mettre un signet dans les lignes contenant l'un d'eux
Si vous souhaitez mettre en avant et de mettre un signet sur les caractères ASCII au lieu de cela, vous pouvez utiliser les regex
[\x00-\x7F]
de le faire.Acclamations
De nouvelles lignes:
Suivante:
Maintenant, Sélectionnez Remplacer l'option Étendue et Remplacez # par \n
🙂 maintenant, vous avez un propre fichier ASCII 😉
Un autre bon truc est d'aller en UTF8 mode dans votre éditeur de sorte que vous pouvez réellement voir ces drôles de personnages et de les supprimer vous-même.
D'une autre façon...
C'est bien si vous ne vous souvenez pas de la regex ou ne se soucient pas de le regarder. Mais les regex mentionné par d'autres, est une belle solution.