1
我想要的豐富網頁摘要數據應用到我的網頁,下面http://schema.org/Article
標準。其中一個屬性是articleBody
,我期望應該包括構成文章的整個文本。如何從豐富的片段元素中排除內容?
不幸的是,該文章的HTML表示會偶爾出現按鈕,廣告和其他提示,其文本不應進入articleBody
。
例如:
<div itemscope itemtype="http://schema.org/Article">
<div itemtype="articleBody">
<p>1st Paragraph</p>
<p>2nd paragraph</p>
<a>A few useful links for my users</a>
<p>3rd paragraph</p>
<div>A few text ads</div>
<p>4th paragraph</p>
</div>
</div>
有沒有辦法排除從文章本身的廣告/鏈接文本?
請注意,您有一個錯誤在你的代碼:'項目類型= 「articleBody」'應該是' itemprop = 「articleBody」'。 – unor