1
我想解析HTML頁面Google play
並獲取有關應用程序的一些信息。簡單的html-dom完美的工作,但如果頁面包含沒有空格的代碼,它完全ingnores屬性。舉例來說,我的html代碼:Simple-html-d跳過屬性
<div class="doc-banner-icon"><img itemprop="image"src="https://lh5.ggpht.com/iRd4LyD13y5hdAkpGRSb0PWwFrfU8qfswGNY2wWYw9z9hcyYfhU9uVbmhJ1uqU7vbfw=w124"/></div>
正如你所看到的,有沒有image
和src
之間的任何空間,所以簡單的HTML DOM忽略src
屬性,只返回<img itemprop="image">
。如果我增加空間,它完美的作品。爲了得到這個屬性我使用下面的代碼:
foreach($html->find('div.doc-banner-icon') as $e){
foreach($e->find('img') as $i){
$bannerIcon = $i->src;
}
}
我的問題是如何改變這個美麗庫得到這個div
的全內的文字?
您可以使用[PHP的DOMDocument](http://php.net/manual/en/class.domdocument.php)而不是簡單的HTML Dom解析器。否則,只需在http://codepad.org/HdUQKx3l查看此代碼片段,只需通過DOMDocument加載並保存HTML即可在Simple HTML Dom Parser上添加所需的空格。 –