我正在編寫一個應用程序來獲取html頁面的標題,一些文本位於body標籤和圖像下。 這是像Facebook的份額的東西。我可以得到一個正則表達式。謝謝你的幫助。正則表達式在標籤之間獲取文本
回答
像<title>(.*?)</title>
這樣的正則表達式會爲您提供標題內容。 。*?部分用於匹配任何字符,以非貪婪的方式(如果頁面中有另一個標題結束標記)。
您應該使用HTML分析器而不是正則表達式。例如,請參閱Simple HTML DOM。
您的任務的正則表達式將非常難以維護,並且在有關頁面的任何更改時都會很容易中斷,更不用說您不能說明HTML註釋。
+1,但我敢肯定,你可以使用正則表達式刪除HTML註釋。 – 2010-07-21 10:33:26
我從來沒有使用過簡單的HTML DOM,我該如何去做。 我想我會安裝任何東西... – 2010-07-21 11:10:13
我剛剛創造了這個表達式,它獲取標籤內的文本(節點值),而沒有實際的標籤本身。
(?<=\"\>)(.*?)(?=\<\/)
您可以用PHP在這裏看到它在行動:http://codepad.viper-7.com/AUTcv3
鏈接現在只顯示你好世界的例子 – CodingYourLife 2015-01-28 00:06:38
- 1. 正則表達式在標籤之間獲取文本
- 2. 使用正則表達式在標籤之間提取標籤和文本
- 3. 使用正則表達式在文本之間獲取文本
- 4. 正則表達式來修改文本在標籤AS3之間
- 5. 正則表達式提取標籤之間的文本,但不是標籤
- 6. 用正則表達式獲取php標籤之間的代碼
- 7. 使用正則表達式來獲取多個HTML標籤之間的文本
- 8. 正則表達式替換標籤之間的文本
- 9. 刪除標籤之間的文本w /正則表達式
- 10. 標籤之間的文本的正則表達式
- 11. 正則表達式刪除標籤之間的文本
- 12. 正則表達式來修剪標籤之間的文本
- 13. PHP正則表達式 - 在斜槓之間獲取文本
- 14. 正則表達式在大括號之間獲取文本
- 15. 使用正則表達式在引號之間獲取文本
- 16. 正則表達式:如何在標籤之間捕獲?
- 17. 正則表達式提取HTML標記之間的文本
- 18. JavaScript正則表達式獲取文本之間的詞
- 19. 正則表達式替換文本之外的腳本標籤
- 20. 正則表達式來移除標籤之間的文本在記事本++
- 21. 正則表達式C++:提取標籤之間的子串
- 22. Java正則表達式提取的標籤之間的內容
- 23. vb.net正則表達式 - 捕獲文本之間的文本
- 24. Ruby正則表達式:在引號之間提取文本
- 25. 正則表達式獲取文本
- 26. 使用正則表達式在標籤之間定位特定文本
- 27. 在JavaScript中使用正則表達式只選擇標籤之間的文本
- 28. 正則表達式在字符串之前獲取文本
- 29. Python的正則表達式外文本與標籤之間的結合文字
- 30. 正則表達式找到文件中的標籤之間的文本
PLS HW去有關這一點,新的正則表達式 – 2010-07-21 11:12:32
感謝我把它 – 2010-07-21 11:41:57