2013-03-31 78 views
-1

我有一個很大的HTML內容條目。我只需要將純文本拆分爲數組中的單獨條目,以便我可以通過翻譯工具運行它,然後將其替換爲原始的html。PHP strip_tags - 將標籤拆分爲數組

我已經設法清除它,然後將行分割成一個數組,但文本...to do this <a href="#" title="blah">click here</a>返回爲...to do this click here

str_replace做一個str_replace由於a標籤,該文本將不再匹配。

所以,我需要一種方法來將通常會使用strip_tags剝離的標籤轉換爲插入的值,我可以使用該值插入字符串。

有什麼建議嗎?

+2

只需使用DOM訪問每個部分。 –

+0

不要重新發明輪子:) http://simplehtmldom.sourceforge.net/ –

+0

而不是SimpleHtmlDom使用這些http://us3.php.net/manual/en/book.dom.php其中的一部分PHP並且會一直工作,不會將您的代碼綁定到您不需要實現此目的的第三方庫。 –

回答

0

好吧,我已經想通了,在這種情況下DOM比我需要的更復雜。

更簡單的解決方案是使用正則表達式匹配來查找所有標記,然後將html分解。

preg_split('/<.+?>/', $html); 

這隻留下文本。由於我不需要任何標籤信息,因此處理速度也應該更快。