我如何可以抓取，並非標籤

<div id="main-content" class="content"> 
<div class="metaline"> 
<span class="article-meta author">jorden</span> 
</div> 
" 
1.name:jorden> 
2.age:28 

    -- 
" 
<span class="D2"> from 111.111.111.111 </span> 
    </div>

我只需要我如何可以抓取，並非標籤

1.name:jorden
2.年齡Web數據：28

xxx.select('#main-content')這將返回所有的事情，但我只需要其中的一部分。因爲他們沒有在任何標籤，我不知道該怎麼辦。

來源

2017-05-23 kovac

該網站的任何鏈接？ –

你想之前找到標籤討論的文字（在你的情況，<div class="metaline">），然後看下一個兄弟在HTML解析樹：

text = soup.find("div", class_='metaline').next_sibling print(text) # " # 1.name:jorden> # 2.age:28 # # -- # " #

一旦你獲得了原始文本，去除它等。

來源

2017-05-23 02:47:07 DyZ

我如何可以抓取，並非標籤

回答

相關問題