我是一個業餘程序員,也是本網站的新成員。我已經搜索了這個問題,但沒有在互聯網或本網站的其他任何地方找到它。Python正則表達式查找語句
我試圖抓住開放和接近段落html標記之間的所有單詞(<p>
& </p>
)。我的findall語句適用於特定在線文章所有段落中的所有單詞,除了單引號或雙引號之外。完全有可能有更好的方法來做我想做的事情,或者可以很容易地調整這個陳述以包含帶引號的段落。任何建議將不勝感激!
的findall聲明:
aText = findall("<p>[A-Za-z0-9<>=\"\:/\.\-,\+\?#@'<>;%&\$\*\^\(\)\[\]\{\}\|\\!_`~ ]+</p>",text)
步驟1)在你喜歡的搜索引擎「美麗的湯」的搜索。第2步)按照其中一個清晰的示例從HTML元素中提取文本。沒有第3步,它實際上是一個相當優雅的圖書館,只是爲了這個目的:) –