大量的空白beautifulsoup

2015-09-07 23 views 3 likes

我正在使用beautifulsoup網頁抓取。該網頁有以下來源：大量的空白beautifulsoup

<td>\n<a href="http://aaa.com">Charles</a>\r\n       (hello)\r\n       </td>, 
<td>\n<a href="http://bbb.com">Diane</a>\r\n       (hi)\r\n       </td>, 
<td>\n<a href="http://ccc.com">Kevin</a>\r\n       (how are you doing)\r\n       </td>

我用下面的代碼來打印兩個值。他們工作得很好。

for item in soup.find_all("td"): 
    print item.find('a').text 
    print item.find('a').next_sibling

問題是當我將輸出保存在csv文件中，第二列沒有值時。這似乎是因爲有很多空白。任何建議？提前致謝。

來源

2015-09-07 kevin

回答

找到所有的next text siblings，加入他們的行列條：

"".join(item.find('a').find_next_siblings(text=True)).strip()

來源

2015-09-07 17:31:48 alecxe

作品！感謝您的解決方案！ – kevin

相關問題

1. BeautifulSoup刪除尾隨空白？
2. 檢查大量空白列
3. Git和大量的空白問題
4. 大空白，WordPress的
5. 大空白HTML
6. HTML＆CSS中的巨大白色空白
7. 想不通哪裏出現大的空白空白
8. 的WebView比需要的高，大量的白色空間
9. BeautifulSoup與空間
10. highcharts用大量的數據呈現空白的PDF使用wicked_pdf