Comment vérifier si un .txt fichier est dans un format ASCII ou UTF-8 format à l'environnement Windows?
J'ai converti un .fichier txt à partir d'ASCII, UTF-8 à l'aide d'UltraEdit. Cependant, je ne suis pas sûr de la façon de vérifier si elle est au format UTF-8 dans l'environnement Windows.
Merci!
Quelle langue utilisez-vous?
L'ASCII est un sous-ensemble de l'UTF-8, de sorte que la "conversion" d'un fichier ASCII fera rien de précis.
Vous pourriez donner un exemple de conversion de scénario à proprement parler un fichier ASCII est déjà un fichier UTF-8. Voulez-vous dire que vous souhaitez que le fichier converti pour avoir un ordre des octets (BOM), ou le fichier d'origine fait de contenir quelques octets qui n'étaient pas ASCII (ie., au-dessus de 0x7f)?
Grâce Kerrek et Michael! En fait, une .fichier txt (je pense à un fichier texte ASCII coder par défaut) a été rejeté par un fournisseur de la raison "Le fichier n'est pas codé en UTF-8". J'ai fait quelques recherches et trouvé une option dans UltraEdit pour convertir ASCII, UTF-8. Donc, avant d'envoyer le fichier pour le vendeur, je voulais être sûr que si il est codé en UTF-8 ou pas. Merci!
L'ASCII est un sous-ensemble de l'UTF-8, de sorte que la "conversion" d'un fichier ASCII fera rien de précis.
Vous pourriez donner un exemple de conversion de scénario à proprement parler un fichier ASCII est déjà un fichier UTF-8. Voulez-vous dire que vous souhaitez que le fichier converti pour avoir un ordre des octets (BOM), ou le fichier d'origine fait de contenir quelques octets qui n'étaient pas ASCII (ie., au-dessus de 0x7f)?
Grâce Kerrek et Michael! En fait, une .fichier txt (je pense à un fichier texte ASCII coder par défaut) a été rejeté par un fournisseur de la raison "Le fichier n'est pas codé en UTF-8". J'ai fait quelques recherches et trouvé une option dans UltraEdit pour convertir ASCII, UTF-8. Donc, avant d'envoyer le fichier pour le vendeur, je voulais être sûr que si il est codé en UTF-8 ou pas. Merci!
OriginalL'auteur rk1962 | 2011-08-04
Vous devez vous connecter pour publier un commentaire.
Fichiers texte dans les Fenêtres n'ont pas un format. Il y a un non-officiel de la convention que si le fichier commence par le NOMENCLATURE codepoint au format UTF-8 que c'est de l'UTF-8, mais cette convention n'est pas universellement pris en charge.
OriginalL'auteur Mark Ransom
Ouvrir le fichier dans le bloc-notes. Cliquez Sur " Enregistrer Sous...". Dans l'Encodage": "combo box, vous verrez le format du fichier en cours.
utilisez Notepad++
OriginalL'auteur Ofer Zelig
Ouvrir le fichier avec Notepad++ et cocher la case "Encodage" dans le menu, vous pouvez vérifier le cours de Codage et/ou de Convertir un ensemble de codages disponibles.
C'est la solution la plus simple présentés et exactement ce que je cherchais. Je soupçonne que votre commentaire a été fait alors que la fin du travail de réponses d'examen de la file d'attente, non?
OriginalL'auteur Miguel Hermoso
L'ouvrir dans un éditeur hexadécimal et assurez-vous que les trois premiers octets sont un BOM UTF8 (
EF BB BF
)Si les trois premiers octets sont (EF BB BF), ça veut dire qu'il est codé en UTF-8 fichier? Merci!!!!
Pas de. Ces mêmes octets sont utilisés par pratiquement n'importe quel extension de l'ASCII, par exemple, Shift-JIS (Japanese).
est-il supprimé le commentaire que vous êtes en train de répondre? J'ai pensé EF BB BF au début d'un fichier a été près d'une garantie de l'UTF-8.
C'est l'âge de 5 ans, donc je ne suis pas certaine à 100%, mais je crois qu'il ne manque aucun commentaire. Il est en effet très probable, mais c'est de la statistique. UTF-8 est commun, et de nombreux fichiers UTF-8 démarrer avec EF BB BF. Otoh, que, d'autres codages sont de plus en plus rares, et dans ces codages EF BB BF est plutôt rare. Pas de garanties, mais.
OriginalL'auteur SLaks