可能重複:
RegEx match open tags except XHTML self-contained tagsPython的正則表達式 - 每提取表格單元格的內容
如果我有一個字符串,它看起來像......
"<tr><td>123</td><td>234</td>...<td>697</td></tr>"
基本上一個有n個單元格的表格行。
Python中獲取每個單元格的值最簡單的方法是什麼?那就是我只想將列表或數組中存儲的值「123」,「234」,「697」或最簡單的值。
我試圖使用正則表達式,當我使用
re.match
我不能讓它發現任何東西。如果我嘗試用
re.search
我只能得到第一個單元格。但我想要所有的細胞。如果我不能用n個單元來做到這一點,你會如何用固定數量的單元來做到這一點?
你可以建議更換爲BeautifulSoup一個很好的教程,所以我可以用它來獲取所有的細胞,逐行?謝謝 – 2012-03-23 02:07:57
該文檔非常好,包含幾個示例:http://www.crummy.com/software/BeautifulSoup/bs4/doc/ – bernie 2012-03-23 02:08:28