UTF-8 problèmes lors de la lecture d'un fichier CSV avec fgetcsv
J'essaie de lire un fichier CSV et echo le contenu. Mais le contenu affiche les caractères de mal.
Mäx Müstermänn -> Mäx Müstermänn
Encodage du fichier CSV est en UTF-8 sans BOM (vérifié avec Notepad++).
C'est le contenu du fichier CSV:
"Mäx";"Müstermänn"
Mon script PHP
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
</head>
<body>
<?php
$handle = fopen ("specialchars.csv","r");
echo '<table border="1"><tr><td>First name</td><td>Last name</td></tr><tr>';
while ($data = fgetcsv ($handle, 1000, ";")) {
$num = count ($data);
for ($c=0; $c < $num; $c++) {
//output data
echo "<td>$data[$c]</td>";
}
echo "</tr><tr>";
}
?>
</body>
</html>
J'ai essayé d'utiliser setlocale(LC_ALL, 'de_DE.utf8');
comme l'a suggéré ici sans succès. Le contenu est toujours mal affiché.
Ce que je suis absent?
Edit:
Un echo mb_detect_encoding($data[$c],'UTF-8');
me donne de l'UTF-8 UTF-8.
echo file_get_contents("specialchars.csv");
me donne "Mäx";"Müstermänn"
.
Et
print_r(str_getcsv(reset(explode("\n", file_get_contents("specialchars.csv"))), ';'))
me donne
Array ( [0] => Mäx [1] => Müstermänn )
Ça veut dire quoi?
- Ce qui se passe quand vous faites echo file_get_contents("specialchars.csv")? Ce qui se passe lorsque vous ne print_r(str_getcsv(reset(explode("\n", file_get_contents("specialchars.csv"))), ';'))?
- J'ai mis à jour ma question!
Vous devez vous connecter pour publier un commentaire.
Essayez ceci:
Rencontré de problème similaire: analyse d'un fichier CSV avec des caractères spéciaux comme é, è, ö etc ...
La suite a bien fonctionné pour moi:
Pour représenter les caractères correctement sur la page html, l'en-tête est nécessaire: l'
Afin d'analyser chaque personnage correctement, j'ai utilisé:
N'oubliez pas de l'utiliser dans toutes les opérations de la chaîne de la " Chaîne multi-octets Fonctions, comme:
utf8_encode
a fait le tour pour moi.Essayer de mettre cela dans le haut de votre fichier (avant toute autre sortie):
enctype="multipart/form-data" accept-charset="utf-8"
. Si j'ai mis ton code dans l'exemple qu'il semble fonctionner.Le problème est que la fonction renvoie UTF-8 (il peut vérifier à l'aide de mb_detect_encoding), mais ne pas convertir les, et ces personnages prend en UTF-8. Par conséquent, il est nécessaire de faire l'inverse-convertir encodage initial (Windows-1251 ou CP1251) à l'aide de iconv. Mais depuis le fgetcsv () retourne un tableau, je suggère d'écrire une fonction personnalisée:
[Désolé pour mon anglais]
Dans mon cas, le fichier source a windows-1250 encodage et iconv imprime des tonnes d'avis au sujet de caractères illégaux dans la chaîne d'entrée...
Donc cette solution m'a beaucoup aidé:
Réponse à @manvel la réponse de l'utilisation str_getcsv au lieu d'exploser - parce que des cas comme celui-ci:
exploser va exploser chaîne en deux parties: l'
mais str_getcsv va exploser chaîne en deux parties: l'
Maintenant, j'ai eu de travail (après retrait de la
header
de commande). Je pense que le problème est que l'encodage du fichier php est en ISO-8859-1. Je l'ai mis à l'UTF-8 sans BOM. J'ai pensé que j'ai déjà fait, mais peut-être j'ai fait une supplémentaire annuler.En outre, j'ai utilisé
SET NAMES 'utf8'
pour la base de données. Maintenant, il est également correct dans la base de données.