2
爲了格式化的目的,我想解析雅虎財務表中的每個單獨統計信息 - 解析整個表格時,格式很糟糕!我目前正在使用下面的代碼,我將不得不重複4行contentA代碼稍作修改,以檢索表格每行內的統計信息。這在下面的contentB變量中有例子。我拒絕相信這是最有效的方式。有什麼建議麼?LXML - 解析tr標籤內的td內容
from lxml import html
url = 'http://finance.yahoo.com/q/is?s=MMM+Income+Statement&annual'
tree = html.parse(url)
contentA = tree.xpath("//table[@class='yfnc_tabledata1']/tr[1]/td/table/tr[2]/td[1]")[0].text_content().strip()
contentA1 = tree.xpath("//table[@class='yfnc_tabledata1']/tr[1]/td/table/tr[2]/td[2]")[0].text_content().strip()
contentA2 = tree.xpath("//table[@class='yfnc_tabledata1']/tr[1]/td/table/tr[2]/td[3]")[0].text_content().strip()
contentA3 = tree.xpath("//table[@class='yfnc_tabledata1']/tr[1]/td/table/tr[2]/td[4]")[0].text_content().strip()
contentB = tree.xpath("//table[@class='yfnc_tabledata1']/tr[1]/td/table/tr[3]/td[1]")[0].text_content().strip()
contentB1 = tree.xpath("//table[@class='yfnc_tabledata1']/tr[1]/td/table/tr[3]/td[2]")[0].text_content().strip()
contentB2 = tree.xpath("//table[@class='yfnc_tabledata1']/tr[1]/td/table/tr[3]/td[3]")[0].text_content().strip()
contentG3 = tree.xpath("//table[@class='yfnc_tabledata1']/tr[1]/td/table/tr[3]/td[4]")[0].text_content().strip()
優秀! 10分爲你:-D –
我將如何自由格式化每個返回的變量?例如,我想要一本字典,其中 總收入:'31,821,000','30,871,000','29,904,000' –
@AranFreel請參閱我的EDIT – styvane