2017-09-29 66 views
0

我試圖preg_match通過guzzle收到的響應。 問題是當我將其內容輸入到我的everything_in_tags函數peg_match函數不會返回任何結果。preg_match和guzzle響應的問題

的功能的preg_match當我的var_dump($這個 - >體)的內容複製粘貼手動進everything_in_tags功能的作用類似於aspected。

轉換後$ this-> body是一個字符串對象。

所以,現在我想知道爲什麼它的行爲如此,有人會如此善良,並告訴我如何解決這個問題。

Thx提前。

代碼:

public function __construct() { 
    $this->dataRaw = (object) []; 
    $this->client = new GuzzleHttp\Client(); 
    $this->res = $this->client->request('GET', 'https://www- genesis.destatis.de/genesisWS/web/ExportService_2010?method=TabellenExport&kennung=kennung&passwort=password&namen=13321-0001&bereich=Alle&format=html&strukturinformation=false&komprimieren=true&transponieren=true&startjahr=2016&endjahr=2017&zeitscheiben=&regionalmerkmal=&regionalschluessel=&sachmerkmal=FAMSTD&sachschluessel=VERH&sachmerkmal2=&sachschluessel2=&sachmerkmal3=&sachschluessel3=&stand=&auftrag=false&sprache=de'); 

    $this->body = (string) $this->res->getBody()->getContents(); 
    $this->dom = new Dom; 

    var_dump($this->body); 


    $this->table = $this->everything_in_tags($this->body, 'table', false); 

    $this->dom->loadStr($this->table , []); 
    $this->html = $this->dom->outerHtml; 
} 

function everything_in_tags($string, $tagname, $inner) { 
    $pattern = "#<\s*?$tagname\b[^>]*>(.*?)</$tagname\b[^>]*>#s"; 
    preg_match($pattern, $string, $matches); 
    return $matches[$inner ? 1 : 0]; 
} 

狂飲 - 響應爲字符串:

 200text/xml;charset=ISO-8859-11Bei mindestens einem Objekt sind Fehler  oder Warnungen aufgetreten.Information13321-000122Mindestens ein Parameter enthält ungültige Werte. Er wurde angepasst, um den Service starten zu können.: zeitscheibenWarnungAktualisierte 
 
Daten28.09.201713321-000109:21:273888 3114 9999674 falseKNZPT13false falseERW0024falseErwerbstätige3Wfalsefalse falseERW1235falseVeränderungsrate zum Vormonat3Wfalsefalse falseERW1246falseVeränderungsrate zum  Vorjahresmonat3WfalsefalseInlands-/ Inländerkonzept0SKfalsefalseTemporär 
 
false133211false falseDINSG2falseDeutschland insgesamt1RKfalsefalseErwerbstätigenrechnung in der VGR (national)0Efalsefalse8925 falseJAHR8false falseMONAT9falseMonate8ZKfalsefalseJahr0ZIfalsefalse falseWERTE17falseWerte0SKfalsefalse 
 
<?xml version="1.0" encoding="utf-8" standalone="no"?> 
 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> 
 
<html xmlns="http://www.w3.org/1999/xhtml"> 
 

 
<head> 
 
    <title>GENESIS-Tabelle: Tempor&#228;r</title> 
 
</head> 
 

 
<body> 
 
    <table border="1" summary="Die Tabelle Tempor&#228;r enth&#228;lt aktuelle Daten zur Statistik - Erwerbst&#228;tigenrechnung in der VGR (national) - mit Stand vom 28.09.2017 "> 
 
    <caption>Erwerbst&#228;tige (inkl. Ver&#228;nderungsraten): Deutschland,<br />Monate, Inlands-/Inl&#228;nderkonzept, original/saisonbereinigte<br />Werte</caption> 
 
    <thead> 
 
     <tr> 
 
     <th id="Z4S1" colspan="8" align="left">Erwerbst&#228;tigenrechnung in der VGR (national)<br />Deutschland</th> 
 
     </tr> 
 
    </thead> 
 
    <tbody>  
 
    </tbody> 
 
    </table> 
 
    <p></p> 
 
    <div class="copyright">&#169; Statistisches Bundesamt (Destatis), 2017 &#160;&#124; Stand: 28.09.2017/09:21:27</div> 
 
    </body> 
 

 
    </html>Alle13321-0001false2017htmlfalseFAMSTDdetruefalse0

回答

0

我假設你狂飲 - 響應作爲字符串是真正的輸出你會得到,那就是:你的瀏覽器會是什麼當你打電話給你的時候

如果這是正確的,那麼很可能是您不明白從該URL返回的內容。什麼是返回是某種包含XML XML的,就像這樣(或遠程的東西類似):

<soapenv:Envelope><soapenv:Body>[content]</soapenv:Body></soapenv:Envelope> 

但是,你的目標的內容最有可能是HTML的轉義,即:在<table>你看在瀏覽器的輸出中實際上是&lt;table&gt;,因爲標記是內容而不是標記。

我的建議是:

  1. 看看在瀏覽器中實際的源代碼(右鍵點擊:凡是查看源代碼或),當你輸出你的狂飲響應,它應該包含比你提供更多的輸出。
  2. 使用xml解析器(或者一個soap解析器,或者任何解析器,不知道這是否實際是rpc)在肥皂信封中查找內容,然後使用xml解析器解析該內容。

這應該夠了。但是,我可能是錯的。