PHP unserialize échoue avec des non-caractères codés?

$ser = 'a:2:{i:0;s:5:"héllö";i:1;s:5:"wörld";}'; //fails
$ser2 = 'a:2:{i:0;s:5:"hello";i:1;s:5:"world";}'; //works
$out = unserialize($ser);
$out2 = unserialize($ser2);
print_r($out);
print_r($out2);
echo "<hr>";

Mais pourquoi?

Dois-je coder avant de serialzing que? Comment?

Je suis à l'aide de Javascript pour écrire la chaîne sérialisée à un champ caché, que PHP $_POST

En JS, j'ai quelque chose comme:

function writeImgData() {
    var caption_arr = new Array();
    $('.album img').each(function(index) {
         caption_arr.push($(this).attr('alt'));
    });
    $("#hidden-field").attr("value", serializeArray(caption_arr));
};

InformationsquelleAutor FFish | 2010-05-17

50

La raison pour laquelle unserialize() échoue avec:
```
$ser = 'a:2:{i:0;s:5:"héllö";i:1;s:5:"wörld";}';
```
Est parce que la longueur de héllö et wörld sont mauvais, car PHP ne gère pas correctement le multi-chaînes d'octets en mode natif:
```
echo strlen('héllö'); //7
echo strlen('wörld'); //6
```
Toutefois, si vous essayez de unserialize() la suite de chaîne correcte:
```
$ser = 'a:2:{i:0;s:7:"héllö";i:1;s:6:"wörld";}';

echo '<pre>';
print_r(unserialize($ser));
echo '</pre>';
```
Cela fonctionne:
```
Array
(
    [0] => héllö
    [1] => wörld
)
```
Si vous utilisez PHP serialize() correctement calculer les longueurs de chaîne multi-byte index.

D'autre part, si vous voulez travailler avec des données sérialisées dans de multiples (programmation) langues, vous devez l'oublier et de passer à quelque chose comme JSON, qui est la façon la plus standardisée.
- grande explication Alix, A++
- bonne prise, j'ai oublié qu'elle pouvait être en UTF-8
- json_encode: "Cette fonction ne fonctionne qu'avec codé en UTF-8 données..." php.net/manual/en/function.json-encode.php
- Oui, et que votre point est..?
- et dans le cas où vous êtes à l'aide de la fonction serialize( ) et unserialize( ) ne répond toujours pas, vérifiez que votre support de stockage. c'est à dire de mysql, vous devez les stocker sous forme de fichiers binaires ou blob. Si vous stockez en tant que texte dans mysql de ne pas traiter vos caractères multi-octets.
- Aussi soyez prudent lors de la commutation entre les environnements php. J'ai couru dans les questions de codage sur un ordinateur local, avant l'enregistrement dans la base de données et ensuite essayer de le unserialize sur le serveur live. Réglage de caractère compte pour les personnages résolu le problème.
- C'est probablement aussi la réponse à un problème que j'ai eu il y a deux ans et n'a jamais trouvé une réponse. stackoverflow.com/questions/30289218/...
InformationsquelleAutor Alix Axel
51

Je sais que cela a été posté comme il y a un an, mais je viens d'avoir ce problème et de trouver ça, et en fait j'ai trouvé une solution pour elle. Ce bout de code fonctionne comme un charme!

L'idée derrière est facile. Il est juste de vous aider par le recalcul de la longueur des chaînes de caractères multi-octets affichés par @Alix ci-dessus.

Quelques modifications devraient convient à votre code:
```
/**
 * Mulit-byte Unserialize
 *
 * UTF-8 will screw up a serialized string
 *
 * @access private
 * @param string
 * @return string
 */
function mb_unserialize($string) {
    $string = preg_replace('!s:(\d+):"(.*?)";!se', "'s:'.strlen('$2').':\"$2\";'", $string);
    return unserialize($string);
}
```
Source: http://snippets.dzone.com/posts/show/6592

Testé sur ma machine, et il fonctionne comme un charme!!
- Belle, résolu le problème pour moi parfaitement. Merci!
- Excellent, merci pour le partage! Solution sympa.
- dans mon cas, le problème était dans l'encodage de la base de données, j'ai donc perdu une partie de mes données dans ???, mais cette fonction me permet de rendre le code du travail, même avec cela, merci
- Juste m'a sauvé un gros mal de tête! Merci.
- Vous m'avez sauvé beaucoup de temps, merci.
- +1 pour ce travail très utile. Je l'ai testé et il fonctionne pour moi sur des données UTF-8 avec les accents français (PHP 5.3 sur mon serveur).
- Découvrez une autre réponse ici que les points qu'il pourrait y avoir de problème avec cette approche 😉
- Bonne prise, je n'aurais pas repéré que. +1 pour @Joe-Hong ainsi. Est-il un moyen de vérifier et de corriger ça?
- Notez que le e modificateur s'en va, le temps de passer à la fonction preg_replace_callback.
- En outre, le "e" modificateur de s'en aller, on va à l'échec sur toute la chaîne a été sérialisé contenant la fin de la recherche regexp (";)
- merci, a fait ma journée
- Merci, cela m'a aidé, fonctionne très bien.
- Cette fonction juste sauvé ma journée! Merci pour le partage!
- J'ai poste en dessous de votre fonction modifiés pour fonctionner avec PHP 5.5. Merci pour votre contribution utile.
- En fait l'Expression Régulière est mal, que la chaîne elle-même peut inclure le motif qui n'est pas liée à la sérialisation de schéma. E. g. Le sérialisé partie ...s:28:"some "quotes"; in the middle";... après votre fonction sera de retour ...s:13:"some \"quotes"; in the middle";.... C'est l'une des raisons de la serializations a été créé à la première place.
- GÉNIALE @lionel-chan j'ai été tellement crispée de la pensée, toutes les données sont allés corrompu. Vous avez sauvé ma vie......merci beaucoup......:):):). CETTE SHOWULD ONT ÉTÉ CORRIGER ACCEPTÉ DE RÉPONDRE À
InformationsquelleAutor Lionel Chan
26

Lionel Chan répondre modifié pour fonctionner avec PHP >= 5.5 :
```
function mb_unserialize($string) {
    $string2 = preg_replace_callback(
        '!s:(\d+):"(.*?)";!s',
        function($m){
            $len = strlen($m[2]);
            $result = "s:$len:\"{$m[2]}\";";
            return $result;

        },
        $string);
    return unserialize($string2);
}    
```
Ce code utilise la fonction preg_replace_callback comme preg_replace avec le modificateur /e est obsolète depuis PHP 5.5.
- J'ai eu à utiliser cette version pour empêcher HTML chaînes codées de tableaux à partir de l'obtention de façon incorrecte échappé des guillemets dans la désérialisation des chaînes de caractères.
- Parfait, merci.
- Un million de merci @David. J'ai eu du mal avec la conversion de cette fonction de nombreux jours maintenant!
InformationsquelleAutor David
8

La question est - comme l'a souligné Alix liées à l'encodage.

Jusqu'à la version PHP 5.4 le codage interne de PHP est l'ISO-8859-1, ce codage utilise un octet pour certains caractères unicode sont multi-octets. Le résultat est que plusieurs octets valeurs sérialisées sur UTF-8, le système ne sera pas lisible sur la norme ISO-8859-1 systèmes.

L'éviter ce type de problèmes, assurez-vous que tous les systèmes d'utiliser le même encodage:
```
mb_internal_encoding('utf-8');
$arr = array('foo' => 'bár');
$buf = serialize($arr);
```
Vous pouvez utiliser utf8_(encode|decode) de nettoyage:
```
//Set system encoding to iso-8859-1
mb_internal_encoding('iso-8859-1');
$arr = unserialize(utf8_encode($serialized));
print_r($arr);
```
InformationsquelleAutor lafka
2

En réponse à @Lionel ci-dessus, en fait la fonction mb_unserialize() comme vous l'avez proposé ne fonctionne pas si la chaîne sérialisée lui-même contient char séquence "; (devis, suivi par un point-virgule).
À utiliser avec prudence. Par exemple:
```
$test = 'test";string'; 
//$test is now 's:12:"test";string";'
$string = preg_replace('!s:(\d+):"(.*?)";!se', "'s:'.strlen('$2').':\"$2\";'", $test);
print $string; 
//output: s:4:"test";string";  (Wrong!!)
```
JSON est la manière d'aller, comme mentionné par d'autres, à mon humble avis

Note: je poste ce que de nouveaux réponse que je ne sais pas comment répondre directement (nouveau ici).
- Vous serez en mesure de vous répondre avec les commentaires bientôt. Continuer à contribuer! Cheers~
InformationsquelleAutor Joe Hong
1

Ne pas utiliser PHP sérialisation/unserialization lorsque l'autre extrémité est pas de PHP. Il n'est pas destiné à être un format portable - par exemple, il inclut même ascii-1 caractères pour les clés protégées qui n'est rien que vous souhaitez traiter en javascript (même si elle fonctionne parfaitement bien, c'est juste très moche).

Au lieu de cela, utilisez un format portable comme JSON. XML pour faire le travail, aussi, mais JSON a moins de frais généraux et plus de programmeurs que vous pouvez facilement analyser en une simple structure de données au lieu d'avoir à traiter avec XPath, DOM arbres etc.
- Pour ne pas mentionner désérialisation provenant de sources non fiables peut provoquer l'exécution de code arbitraire.
InformationsquelleAutor ThiefMaster
1

Encore une légère variation, ici, qui nous l'espérons aider quelqu'un ... j'ai été la sérialisation d'un tableau puis de les écrire sur une base de données. Sur la récupération des données de la unserialize opération a été un échec.

Il s'avère que la base de données longtext domaine que j'écrivais, c'était à l'aide de latin1 pas en UTF8. Quand je l'ai mis rond, tout a fonctionné comme prévu.

Merci à tous les ci-dessus qui ont mentionné l'encodage des caractères et m'a mis sur la bonne voie!

InformationsquelleAutor Mike
0

Je vous conseille d'utiliser le javascript pour encoder en json et ensuite utiliser la fonction json_decode à unserialize.
- aha, bon conseil. J'espère que ça fonctionne avec ces fichues éèçàôöï caractères..
- cela dit, $ser = 'a:2:{i:0;s:5:"héllö";i:1;s:5:"wörld";}'; var_dump(unserialize($ser)); fonctionne très bien avec moi. Qu'entendez-vous par un échec? L'appel à unserialize() échoue?
- il me donne: bool(false)
InformationsquelleAutor Artefacto

, nous pouvons briser la chaîne à un tableau:

$finalArray = array();
$nodeArr = explode('&', $_POST['formData']);

foreach($nodeArr as $value){
    $childArr = explode('=', $value);
    $finalArray[$childArr[0]] = $childArr[1];
}

InformationsquelleAutor Rondip

Sérialiser:

foreach ($income_data as $key => &$value)
{
    $value = urlencode($value);
}
$data_str = serialize($income_data);

Unserialize:

$data = unserialize($data_str);
foreach ($data as $key => &$value)
{
    $value = urldecode($value);
}

InformationsquelleAutor sNICkerssss

ce a travaillé pour moi.

function mb_unserialize($string) {
    $string = mb_convert_encoding($string, "UTF-8", mb_detect_encoding($string, "UTF-8, ISO-8859-1, ISO-8859-15", true));
    $string = preg_replace_callback(
        '/s:([0-9]+):"(.*?)";/',
        function ($match) {
            return "s:".strlen($match[2]).":\"".$match[2]."\";"; 
        },
        $string
    );
    return unserialize($string);
}

InformationsquelleAutor Paolo Josef Abadesco

Dans mon cas, le problème était avec les fins de ligne (probablement quelques éditeur ont changé mon fichier DOS vers Unix).

J'ai mis en place ces apadtive wrappers:

function unserialize_fetchError($original, &$unserialized, &$errorMsg) {
    $unserialized = @unserialize($original);
    $errorMsg = error_get_last()['message'];
    return ( $unserialized !== false || $original == 'b:0;' );  //"$original == serialize(false)" is a good serialization even if deserialization actually returns false
}

function unserialize_checkAllLineEndings($original, &$unserialized, &$errorMsg, &$lineEndings) {
    if ( unserialize_fetchError($original, $unserialized, $errorMsg) ) {
        $lineEndings = 'unchanged';
        return true;
    } elseif ( unserialize_fetchError(str_replace("\n", "\n\r", $original), $unserialized, $errorMsg) ) {
        $lineEndings = '\n to \n\r';
        return true;
    } elseif ( unserialize_fetchError(str_replace("\n\r", "\n", $original), $unserialized, $errorMsg) ) {
        $lineEndings = '\n\r to \n';
        return true;
    } elseif ( unserialize_fetchError(str_replace("\r\n", "\n", $original), $unserialized, $errorMsg) ) {
        $lineEndings = '\r\n to \n';
        return true;
    } //else
    return false;
}

InformationsquelleAutor Vittorio Zamparella

-1

/**
 * MULIT-BYTE UNSERIALIZE
 *
 * UTF-8 will screw up a serialized string
 *
 * @param string
 * @return string
 */
function mb_unserialize($string) {
    $string = preg_replace_callback('/!s:(\d+):"(.*?)";!se/', function($matches) { return 's:'.strlen($matches[1]).':"'.$matches[1].'";'; }, $string);
    return unserialize($string);
}

InformationsquelleAutor Rogério Agostini

Vous devez vous connecter pour publier un commentaire.