如何最好地將所有輸入字段(文本,單選按鈕,複選框,選擇等)半自動地從惡意格式化的html文檔中取出?減去表單輸入字段的最佳方法html
試圖獲得TYPE,NAME,VALUE
和OPTION
爲SELECT
。
我目前正在使用Xpath(在PHP中),因爲這裏的每個人都說'用來代替',但我沒有得到它。所以我願意接受建議。我有一個外殼,所以它可能是'普通'grep。
謝謝。 馬特
如何最好地將所有輸入字段(文本,單選按鈕,複選框,選擇等)半自動地從惡意格式化的html文檔中取出?減去表單輸入字段的最佳方法html
試圖獲得TYPE,NAME,VALUE
和OPTION
爲SELECT
。
我目前正在使用Xpath(在PHP中),因爲這裏的每個人都說'用來代替',但我沒有得到它。所以我願意接受建議。我有一個外殼,所以它可能是'普通'grep。
謝謝。 馬特
爲 '幾乎沒有' 解決方案請參見本:
Get HTML page <input> values and names using regex on PHP
謝謝!
你可以使用jQuery框架結合良好的舊Firebug(Firefox插件)。 jQuery的選擇器引擎將使您可以輕鬆找到表單元素的所有實例。 Firebug會很高興地將它登錄到Firefox的Javascript控制檯。
正如你所說:這是半自動的。
編輯
爲了讓您一開始你可能想看看jQuery's API(它是幫助你大的時候方便的序列化方法)。
你想做什麼?你只是想找到他們的位置?或者實際修改它們? – Seaux 2010-03-05 23:40:55
這些是靜態的形式,我試圖讓他們在列表中(類型 - >名稱 - >值或選項),因爲我需要重建它們(在CMS中) – MattW 2010-03-05 23:50:09