PHP怎么接收XML格式数据_解析XML字符串为数组教程【详解】

PHP接收POST XML数据需用file_get_contents('php://input')读取原始流,因$_POST不解析XML;解析时注意UTF-8编码、BOM、命名空间和CDATA处理,推荐DOMDocument配合SimpleXML或XPath提取。

PHP怎么接收POST过来的XML原始数据

PHP默认不会自动解析XML格式的请求体,$_POST 为空,必须手动读取原始输入流。常见于第三方接口(如微信支付回调、银行网关通知)推送的XML数据。

关键点:不能依赖 $_POST,要从 php://input 读取;且需确保 Content-Type 是 text/xmlapplication/xml(否则部分Nginx/PHP-FPM配置会截断)。

  • file_get_contents('php://input') 是最稳妥方式,适用于所有POST XML场景
  • 避免用 $HTTP_RAW_POST_DATA(PHP 5.6+ 已废弃,7.0+ 移除)
  • 若用 cURL 测试,记得加头:-H "Content-Type: text/xml"
$xmlString = file_get_contents('php://input');
if (empty($xmlString)) {
    http_response_code(400);
    exit('No XML data received');
}

simplexml_load_string() 解析失败的常见原因

这是最常用的XML转对象方法,但极易因编码、命名空间或格式错误而返回 false,且不报错——只静默失败。

  • XML字符串必须是UTF-8编码,含BOM会导致解析失败(可用 trim($xmlString, "\xEF\xBB\xBF") 去BOM)
  • 含命名空间(如 )时,simplexml_load_string() 默认忽略前缀,需用 ->children('soap', true) 显式访问
  • 根节点含属性(如 )时,属性需用 ->attributes() 单独取,不能当子元素访问
  • 空标签()会被转成空对象,不是空字符串,判空要用 !isset($node->{''}) 或强制转字符串再 trim

把SimpleXMLElement转成普通数组的可靠写法

SimpleXML对象不能直接 json_encodeprint_r 出完整结构,必须递归转换。PHP自带的 json_decode(json_encode($obj), true) 虽快但有坑:

  • 丢失XML属性(如 abc 中的 id 会消失)
  • 同名多节点(如多个 )会被覆盖为单个,除非手动包裹成数组
  • 数字索引标签(如 val0>)在 json_encode 后键名会丢失

更稳的方式是手写递归函数,显式处理属性和子节点:

function xml_to_array($xmlObject) {
    $array = [];
    foreach ($xmlObject->children() as $key => $value) {
        $children = $value->children();
        $attrs = $value->attributes();
        if (count($children) === 0 && count($attrs) === 0) {
            $array[$key] = (string)$value;
        } else {
            $array[$key] = [
                '_value' => (string)$value,
                '_attrs' => array_map('strval', (array)$attrs),
                '_children' => xml_to_array($value)
            ];
        }
    }
    return $array;
}

遇到CDATA内容被忽略或转义怎么办

SimpleXML 默认会把 当作普通文本节点,但有时会意外丢掉或变成空字符串,尤其在嵌套或混合文本节点时。

  • 确保XML字符串本身未被PHP其他函数(如 htmlspecialchars)提前转义过
  • libxml_disable_entity_loader(false)(PHP 8.0+ 已移除该函数,无需调用)
  • 更可靠做法:先用 DOMDocument 加载,它对 CDATA 支持更完整,再转 SimpleXML
$dom = new DOMDocument();
$dom->loadXML($xmlString);
$xmlObj = simplexml_import_dom($dom);
$array = xml_to_array($xmlObj);
实际项目中,XML结构越复杂(多层嵌套、混合CDATA、动态命名空间),越建议用 DOMDocument + XPath 定位取值,而不是强求一步转数组。很多“解析失败”问题,根源不在解析逻辑,而在没看清原始XML的真实结构。