PHP中的json_encode与中文

146 阅读1分钟

我们知道, 用PHP的json_encode来处理中文的时候, 中文都会被编码, 变成不可读的, 类似"\u***"的格式, 还会在一定程度上增加传输的数据量,一个字符变成了多个字符。类似于这样:

<?php

$a = [
    "name"=>"明里紬",
    "age"=>21,
];

$str = json_encode($a);
echo $str, PHP_EOL, strlen($str);
{"name":"\u660e\u91cc\u7d2c","age":21}
38

而在PHP5.4, 这个问题终于得以解决, Json新增了一个选项: JSON_UNESCAPED_UNICODE, 故名思议, 就是说, Json不要编码Unicode

<?php

$a = [
    "name"=>"明里紬",
    "age"=>21,
];

$str = json_encode($a, JSON_UNESCAPED_UNICODE);
echo $str, PHP_EOL, strlen($str);
{"name":"明里紬","age":21}
29

是不是看着舒服多了呢,而且在存储和传输上都能节省不少字节。

者还不算完,对于一个大的数据结构,输出的Json串可读性不好,于是常量JSON_PRETTY_PRINT就排上用场了。

<?php

$a = [
    "name"=>"明里紬",
    "age"=>21,
];

$str = json_encode($a, JSON_UNESCAPED_UNICODE | JSON_PRETTY_PRINT);
echo $str, PHP_EOL, strlen($str);
{
    "name": "明里紬",
    "age": 21
}
42

看到效果了吧。同时 json 序列化还有很多常量可用,参考 www.php.net/manual/zh/j…