前標籤:我要清理的「腳本」的標籤,但我想保持的一個標籤,最好蟒蛇LIB清潔標籤(不安全),並保持,我認爲安全
所以你用什麼lib來做到這一點。
和我使用所見即所得的HTML編輯器的jquery cleditor,它可以自動執行此操作嗎?
謝謝
前標籤:我要清理的「腳本」的標籤,但我想保持的一個標籤,最好蟒蛇LIB清潔標籤(不安全),並保持,我認爲安全
所以你用什麼lib來做到這一點。
和我使用所見即所得的HTML編輯器的jquery cleditor,它可以自動執行此操作嗎?
謝謝
我想BeautifulSoup應該做的伎倆,在這裏。
其實,這裏有一個問題的答案+這也正是有關:Python HTML sanitizer/scrubber/filter
我必須自動爲我的一個項目做到這一點。我找到的解決方案是使用Beautiful Soup模塊來提取腳本標記(我也是這樣做的風格和形式)。
soup = BeautifulSoup(html_string, convertEntities=BeautifulSoup.HTML_ENTITIES)
scripts = soup.findAll('script') # find and return a list of 'script' entities
for s in scripts:
s.extract() # remove it from the DOM completely
然後,你可以有BeautifulSoup打印出來或保存html。
另一種選擇,專爲消毒,是html5lib。
無論你做什麼,做而不是依靠一個編輯器組件來爲你做:它運行在客戶端,所以很容易被操縱提交無效或惡意的HTML!