我有一個奇怪的問題,我的電腦對這個python腳本的反應與其他人的電腦不同(imOX在macOX Mountain Lion python v = 2.7)。任何想法如何解決這個問題,或者請在你的系統上報告輸出? 我只得到一行輸出,而其他人似乎正確地得到所有行。不幸的是,它不適用於我的系統,我是需要它工作的人。我的系統打印的表的最後一行是被抓取:Python循環或輸出 - 只在我的電腦上
import urllib
from bs4 import BeautifulSoup
#file_name = "https://stackoverflow.com/users/ripple/uspc-cpc.txt"
#file = open(file_name,"w")
i=125
while i==125:
url = "http://www.uspto.gov/web/patents/classification/cpc/html/us" + str(i) + "tocpc.html"
print 'Grabbing from: ' + url + '\n'
i += 1
#get the table data from the page
data = urllib.urlopen(url).read()
#send to beautiful soup
soup = BeautifulSoup(data)
table = soup.find("table", width='80%')
for tr in table.findAll('tr')[2:]:
col = tr.findAll('td')
#print 'hi'
uspc = col[0].get_text().encode('ascii','ignore').replace(" ","")
cpc1 = col[1].get_text().encode('ascii','ignore').replace(" ","")
cpc2 = col[2].get_text().encode('ascii','ignore').replace(" ","")
cpc3 = col[3].get_text().encode('ascii','ignore').replace(" ","").replace("more...", "")
record = uspc + ',' + cpc1 + ',' + cpc2 + ',' + cpc3 + '\n'
print record
#file.write(record)
#file.close()
適用於Linux上的我。 – 2013-04-09 18:17:24
@QuentinEngles:鑑於OP明確表示它在除了OS X Mountain Lion框之外的所有人的計算機上都能正常工作,該評論有多大幫助? – abarnert 2013-04-09 18:20:36
美麗的湯可以使用各種不同的解析器,具體取決於安裝的內容。很可能你有一些錯誤或只是複雜的HTML,並且你得到了不同的結果,因爲它在你的計算機上使用的是不同於你測試的其他解析器(例如,它使用'html.parser'而不是'lxml'它們,或者它們都使用'html.parser',但是你運行的是Python 2.7.2,它們運行的是2.7.3或2.7.4,或者...)。你能訪問其他計算機來運行一些測試嗎? – abarnert 2013-04-09 18:23:03