對於第二部分,如果您使用Chrome,請右鍵單擊「計算字數」按鈕並選擇「檢查元素」。你會看到它POST
是個形式/index.php
與一些相關作品:
name="text"
name="optionSyllableCount"
name="optionWordCount"
(後兩個是輸入複選框,這通常需要一個價值POST)。
import urllib
url = 'http://www.wordcalc.com/index.php'
post_data = urllib.urlencode(
{'text': 'virgina'})
post_data = '%s&optionSyllableCount&optionWordCount' % post_data
cnxn = urllib.urlopen(url, post_data)
response = cnxn.read()
cnxn.close()
如果你想解析響應您可以:
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(response)
h3_matches = [h3 for h3 in soup.findAll('h3') if h3.text == 'Statistics']
if len(h3_matches) != 1:
raise Exception('Wrong number of <h3>Statistics</h3>')
h3_match = h3_matches[0]
table = h3_match.findNextSibling('table')
td_matches = [td for td in table.findAll('td')
if td.text == 'Syllable Count']
if len(td_matches) != 1:
raise Exception('Wrong number of <td>Syllable Count</td>')
td_match = td_matches[0]
td_value = td_match.findNextSibling('td')
syllable_count = int(td_value.text)
響應很好,並且及時。我接受了另一個,因爲它更簡單(並且不需要互聯網)。但是,我可能最終也會實現這一個,所以我可以在下次學會如何去做。 – SomeKittens