2014-02-21 73 views
0

我現在正在積極研究前端開發,爲了更好地保留材料,我在Anki中創建了閃存卡。如何從this page表中自動提取數據並將其保存爲「問題(屬性)---答案(描述)」的格式?如何從其他網站自動提取表格的內容?

+0

你想把它保存到數據庫嗎?什麼是最終目標? –

+0

最終目標是將此數據粘貼到Anki(間隔重複軟件)中,並填入「Math.ceil()所做的事情」等。 –

+0

您對該網站的許可是否受到許可?如果你要偷的話不要偷從許多人認爲是互聯網上最危險的無用資源 – 2014-02-21 03:09:52

回答

1

由於same origin policy,您將不得不使用Javascript下載HTML。您可以運行本地託管服務器,下載並解析HTML,然後通過JSON或XML將數據發送到瀏覽器並在此時顯示。

+0

謝謝!大聲笑我應該猜到了。 –

0

同意@Cameron Askew。您可以使用服務器端語言,如:php,java或nodejs來獲取html文檔並使用正則表達式進行分析,然後在客戶端使用ajax來獲取它。

+0

用正則表達式解析HTML! [AHHHH](http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags)。大聲笑,這是一個有趣的閱讀,如果你還沒有閱讀。但是,使用正則表達式解析一個簡單的表是pbb好,但我喜歡XML解析器,讓我的生活更輕鬆我想! –

+0

你說得對,正則表達式不是最好的方法。解析像javascript dom這樣的html將是一個更好的方法。 Thx提醒我〜。 :) –