我想提取某種形式的元素的密鑰值對在一個HTML頁面提取物形式的鍵值對形成html頁面在Python或解析HTML頁面
例如
name="frmLogin" method="POST" onSubmit="javascript:return validateAndSubmit();" action="TG_cim_logon.asp?SID=^YcMunDFDQUoWV32WPUMqPxeSxD4L_slp_rhc_rNvW7Fagp7FgH3l0uJR/3_slp_rhc_dYyJ_slp_rhc_vsPW0kJl&RegType=Lite_Home"
而原來的線是
<form name="frmLogin" method="POST" onSubmit="javascript:return validateAndSubmit();" action="TG_cim_logon.asp?SID=^YcMunDFDQUoWV32WPUMqPxeSxD4L_slp_rhc_rNvW7Fagp7FgH3l0uJR/3_slp_rhc_dYyJ_slp_rhc_vsPW0kJl&RegType=Lite_Home">
是有使用,我可以放心地拿到鑰匙和值對任何方法。我嘗試使用空格拆分,然後使用'='字符,但引號內的字符串也可以具有'='。
是否有任何不同類型的拆分方法,也可以照顧引號?
轉義雙引號可能會造成問題。 –
@JanDvorak我從來沒有見過任何引號在HTML中轉義,但的確,這可能是一個問題... – rayfranco
[Obligatory](http://stackoverflow.com/a/1732454/566644)。 –