2013-10-29 63 views
0

我想從PHP數組中刪除一些特殊/奇怪的字符。
數據進來作爲JSONhtml這樣的:從php中刪除奇怪的字符

<table class=\"MsoNormalTable\" border=\"0\" cellspacing=\"0\" cellpadding=\"0\" width=\"728\" style=\"width:545.75pt; margin-left:-1.7pt; border-collapse:collapse\">\r\n<tbody>\r\n<tr style=\"height:15.0pt\">\r\n<td width=\"303\" valign=\"top\" style=\"width:227.0pt; border:solid windowtext 1.0pt; padding:0cm 5.4pt 0cm 5.4pt; height:15.0pt\">\r\n<p class=\"MsoNormal\" style=\"line-height:115%\"><span style=\"font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;; color:black\">Policy number:<\/span><\/p>\r\n<\/td>\r\n<td width=\"425\" nowrap=\"\" valign=\"bottom\" style=\"width:318.75pt; border:solid windowtext 1.0pt; border-left:none; padding:0cm 5.4pt 0cm 5.4pt; height:15.0pt\">\r\n<p class=\"MsoNormal\" style=\"line-height:115%\"><span style=\"font-family:&quot;Calibri&quot;,&quot;sans-serif&quot;; color:black\">&nbsp;LAP3_MC_2011030004&nbsp;\r\n<\/span><\/p>\r\n<\/td>\r\n<\/tr>\r\n<tr style=\"height:15.0pt\">\r\n<td width=\"303\" nowrap=\"\" valign=\"bottom\" style=\"width:227.0pt; border:solid windowtext 1.0pt; border-top:none; padding:0cm 5.4pt 0cm 5.4pt; height:15.0pt\"> 

我正在讀的數據,並過濾出我需要使用DomCrawler睫狀和輸出是:

string(4) "�Mr�" 

我已嘗試

iconv("UTF-8", "ISO-8859-1//TRANSLIT", $l->nodeValue); 

但它不刪除怪異鑽石字符

任何想法如何解決這個??

+0

'函數utf8_encode($字符串)'或'utf8_decode($字符串)'始終是一個良好的開端。 – h2ooooooo

+0

這隻有在您顯示數據時纔會發生?在裏面加''標籤:'' – Latheesan

+0

我將數組傾倒出來,它給了我角色。我無法將源HTML更改爲由第三方提供。我嘗試了utf_decode和utf_encode,它只是給字符串添加了更多的空格。 –

回答

1

嘗試

iconv("UTF-8", "ISO-8859-1//IGNORE", $l->nodeValue); 

OR

mb_convert_encoding ($l->nodeValue, "ISO-8859-1", "UTF-8")