2017-05-23 29 views
1
<div id="main-content" class="content"> 
<div class="metaline"> 
<span class="article-meta author">jorden</span> 
</div> 
" 
1.name:jorden> 
2.age:28 

    -- 
" 
<span class="D2"> from 111.111.111.111 </span> 
    </div> 

我只需要我如何可以抓取,並非標籤

1.name:jorden
2.年齡Web數據:28

xxx.select('#main-content')這將返回所有的事情,但我只需要其中的一部分。 因爲他們沒有在任何標籤,我不知道該怎麼辦。

+0

該網站的任何鏈接? –

回答

1

你想之前找到標籤討論的文字(在你的情況,<div class="metaline">),然後看下一個兄弟在HTML解析樹:

text = soup.find("div", class_='metaline').next_sibling 
print(text) 
# " 
# 1.name:jorden> 
# 2.age:28 
# 
# -- 
# " 
# 

一旦你獲得了原始文本,去除它等。

相關問題