這是一個beautifulsoup
過程,它抓取所有<p>
html標籤內的內容。從某些網頁抓取內容後,我收到一個錯誤,指出超出最大遞歸深度。Beautifulsoup,最大遞歸深度達到
def printText(tags):
for tag in tags:
if tag.__class__ == NavigableString:
print tag,
else:
printText(tag)
print ""
#loop over urls, send soup to printText procedure
跟蹤底:
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 16, in printText
printText(tag)
File "web_content.py", line 13, in printText
if tag.__class__ == NavigableString:
RuntimeError: maximum recursion depth exceeded in cmp
你能解釋一下嗎?這是從前一個url崩潰之後的示例輸出。 「原來是兩個月的過程對於許多公司來說現在是一個爲期五天的過程 在可兌換的情況下提高1到200萬的問題......」這包含字符串以及單長字符串。 – yayu 2012-04-12 06:08:41
哪部分你不明白,迭代或迭代?當然,這一切都取決於你瞭解代碼的工作原理。 – 2012-04-12 06:09:55
你能澄清一下「你打了一根繩子」是什麼意思?你是什麼意思「打」?是不是美麗的湯解析成DOM的整個HTML文檔最初是一個字符串 - 而不是標籤本身的字符串?我們遇到了相同的錯誤,只是試圖用12個錨點將值替換成簡單的HTML頁面,但不清楚什麼是觸發遞歸。 – Praxiteles 2016-01-07 10:55:52