12
我試圖將通過BeautifulSoup提取的錶轉換爲JSON。將HTML錶轉換爲JSON
到目前爲止,我已經設法隔離所有行,但我不知道如何處理來自這裏的數據。任何建議將非常感激。
[<tr><td><strong>Balance</strong></td><td><strong>$18.30</strong></td></tr>,
<tr><td>Card name</td><td>Name</td></tr>,
<tr><td>Account holder</td><td>NAME</td></tr>,
<tr><td>Card number</td><td>1234</td></tr>,
<tr><td>Status</td><td>Active</td></tr>]
(換行符礦的可讀性)
這是我的嘗試:
result = []
allrows = table.tbody.findAll('tr')
for row in allrows:
result.append([])
allcols = row.findAll('td')
for col in allcols:
thestrings = [unicode(s) for s in col.findAll(text=True)]
thetext = ''.join(thestrings)
result[-1].append(thetext)
這給了我下面的結果:
[
[u'Card balance', u'$18.30'],
[u'Card name', u'NAMEn'],
[u'Account holder', u'NAME'],
[u'Card number', u'1234'],
[u'Status', u'Active']
]
非常感謝,我得到這是由於一些字符在服務器的響應的編碼,一旦我想通了這一點你的回答非常完美錯誤。再次感謝,祝你有美好的一天。 – declanjscott