2012-03-13 79 views
0

在Python中有一個庫來計算在html上顯示的東西的大小嗎?字數,表單大小,在html中顯示的東西大小

爲例:

<a href="">titi</a> 

這裏只蒂蒂計數,並在窗體上4

的大小事顯示?

<input type="text" size="10" maxlength="40" name="name"> 

這裏現在十

或我必須做一個分析?

問候

BUSSIERE

回答

0

您需要解析HTML。

使用像Beautiful Soup這樣的庫來根據需要解析值和屬性,然後可以識別表單屬性的數值或計算標記中文本的長度。

每文檔鏈接,如果你跑了通過美麗的湯的HTML

from bs4 import BeautifulSoup 
# html_doc is presumed to already contain the contents of the HTML document 
soup = BeautifulSoup(html_doc) 

然後,您可以找到文檔標題的長度,例如

print "Document title length: %s" % len(soup.title.string) 

或者每個鏈接的文本

doc_links = soup.find_all('a') 
link_text_length = [len(link.string) for link in 
     doc_links if len(link.string) > 40] 
total_long_links = len(link_text_length) 
print "%s links are too long in the document" % total_long_links 
相關問題