2014-10-05 8 views
-1

早上好!Strip_Tags產生奇怪的結果以及如何將HTML標記顯示爲文本

我想刮一個CME網頁,將底部的表拉到一個二維數組。 (http://www.cmegroup.com/trading/equity-index/us-index/e-mini-sandp500_quotes_settlements_futures.html

代碼如下。問題是,var_dump表示字符串(507),但僅顯示大約300個字符!三個問題:

1)如何顯示任何隱藏的標籤或字符? 2)爲什麼會說507個字符,但只顯示大約300個字符? 3)如何刪除隱藏的字符?

謝謝你的幫助!

這裏是我使用的代碼:

$EMiniURL = "http://www.cmegroup.com/trading/equity-index/us-index/e-mini-sandp500_quotes_settlements_futures.html"; 
$EMiniRaw = file_get_contents($EMiniURL); 
$EMiniRaw = strip_tags($EMiniRaw); 
$StartChr = strpos($EMiniRaw, "About This Report") + strlen("About This Report"); 
$EndChr = strpos($EMiniRaw, "Total", $StartChr) - strlen("Total"); 
$TotalLen = $EndChr - $StartChr; 
$RawStr = substr ($EMiniRaw, $StartChr, $TotalLen); 
var_dump ($RawStr); 

這裏是後續代碼var_dump結果:

串(532)「12月14日1938.50 1964.50 1935.75 1959.75 21.75 1960.25 1551405 2751445 3月15日1931.00 1956.25B 1928.00A 1952.00A +21.75 1952.50 2,244 5,495 JUN 15 1920.25 1949.00B 1920.25 1945.00A +22.00 1945.50 88 350 SEP 15 1925.00 1937.75B 1925.00 1937.75B +21.75 1938.75 6 204 DEC 15 1935.75 1935.75 1935.75 1935.75 +22.00 1932.75 1 212「

+0

1)有空格字符,它們不能顯示2)看,1 3)http://stackoverflow.com/問題/ 2109325/how-to-strip-all-spaces-out-of-a-in-php – sinisake 2014-10-05 21:06:03

+0

謝謝!它怎麼樣我沒有看到近200個空白字符?我試着將輸出的屏幕複製到Word中,並計算字符和空格,但仍然只有300個左右。我也試過修剪。並沒有區別。思考? – expertalmost 2014-10-05 22:17:46

回答

0

原來是這樣新行和標籤。顯然,PHP strip_tags並不會刪除所有內容。用下面的完成清理:

$NewStr = preg_replace("/\s+/", " ", $OldStr); 

只是說;)