html = """
...
<tt class="descname">all</tt>
<big>(</big>
<em>iterable</em>
<big>)</big>
<a class="headerlink" href="#all" title="Permalink to this definition">¶</a>
...
"""
我想要在起始標記big
到第一個出現a
標記之間的所有文本。這意味着如果我拿這個例子,那麼我必須得到(iterable)
作爲一個字符串。如何使用BeautifulSoup在兩個指定標籤之間獲取所有文本?
是的,沒錯,我想包括一切到下一個標記「a」,並且可能有任何數量的標記,第一個「大」標記和第一個「a」標記之間的文本 – 2012-08-04 14:37:38