是否有可能從beautifulsoup導航樹
<td class="text">
得到的字符串,而是通過從標籤
<a name="rknjiga">
導航,因爲它是用來針對頁面的特定部分。我曾嘗試使用
soup.find("a", {"name": "aknjiga"}).parent
,但只讓我1點了,我的想法是去的第一TR標籤,一個步驟了層次結構,然後通過使用.next_sibling到把指針指向下一個TR標籤
<tr>
<td bgcolor="#CDC5A1"> </td>
<td colspan="2" bgcolor="#CDC5A1" class="bbrownnaslov1">
<a name="rknjiga">Poglavlja u knjizi</a> #name rknjiga is used to find section
</td>
</tr>
<tr>
<td height="92" valign="top">
<table width="100%" border="0" cellspacing="2" cellpadding="0">
<tr>
<td class="text">
<br/>1. Dražić, Ivan; Mujaković, Nermina.<br/>
</td>
</tr>
<tr>
<td class="text" align="right" valign="bottom">
<a href="#top"></a>
</td>
</tr>
<tr>
<td class="text" align="right" valign="bottom">
<img src="images/spacer.gif" width="1" height="1">
</td>
</tr>
</table>
</td>
</tr>
輸出需要寫入的txt文件格式:
- Dražić,伊萬; Mujaković,Nermina。
- Crnković,院長; Vedrana的MikulićCrnković; Rodrigues,B.G. ...
我第一次使用美麗的,所以任何建議,歡迎!
你想要什麼樣的輸出。 –
我想寫在txt文件中, – LuckyStrike
根據你的html,發佈一個示例txt數據,這將是有幫助的 –