0
在Python中有一個庫來計算在html上顯示的東西的大小嗎?字數,表單大小,在html中顯示的東西大小
爲例:
<a href="">titi</a>
這裏只蒂蒂計數,並在窗體上4
的大小事顯示?
<input type="text" size="10" maxlength="40" name="name">
這裏現在十
或我必須做一個分析?
問候
BUSSIERE
在Python中有一個庫來計算在html上顯示的東西的大小嗎?字數,表單大小,在html中顯示的東西大小
爲例:
<a href="">titi</a>
這裏只蒂蒂計數,並在窗體上4
的大小事顯示?
<input type="text" size="10" maxlength="40" name="name">
這裏現在十
或我必須做一個分析?
問候
BUSSIERE
您需要解析HTML。
使用像Beautiful Soup這樣的庫來根據需要解析值和屬性,然後可以識別表單屬性的數值或計算標記中文本的長度。
每文檔鏈接,如果你跑了通過美麗的湯的HTML
from bs4 import BeautifulSoup
# html_doc is presumed to already contain the contents of the HTML document
soup = BeautifulSoup(html_doc)
然後,您可以找到文檔標題的長度,例如
print "Document title length: %s" % len(soup.title.string)
或者每個鏈接的文本
doc_links = soup.find_all('a')
link_text_length = [len(link.string) for link in
doc_links if len(link.string) > 40]
total_long_links = len(link_text_length)
print "%s links are too long in the document" % total_long_links