2010-12-17 55 views
0

作爲我在網站上做的工作的一部分,我必須從舊網站的多個頁面複製幾千行文本並將它們粘貼到HTML中新的網站。去舊頁面和複製許多文本行,然後去我的編輯器並逐行粘貼它的漫長而艱辛的方式變得非常古老。我想使用注入JavaScript來做到這一點,但我不知道從哪裏開始。預先感謝您的幫助。使用注入的JavaScript從網頁複製文本

以下是指向舊網站頁面和新網站頁面的鏈接。正如您在每個頁面的表格中看到的那樣,需要大量時間手動複製所有內容。

舊網站:http://temp.delridgelegalformscom.officelive.com/macorporation1.aspx

新建站點:http://ezwebsites.us/delridge/macorporation1.html

+0

你可以發佈一些HTML來告訴我們有關格式和等? – Qix 2010-12-17 20:59:03

+0

我剛剛將我正在使用的2個站點的鏈接添加到我的問題中。 – Blake 2010-12-17 21:05:11

+0

你有權訪問服務器?爲什麼你不能只寫一個unix/dos腳本來複制你需要的網站? – 2010-12-17 21:22:22

回答

2

爲了做這種類型的工作,你需要兩樣東西:注射或方式在該頁面上執行您的腳本,以及對目標站點的文檔對象模型有良好的工作知識。

我強烈建議使用Firefox插件FireBug,或者在您選擇的瀏覽器上使用一些等效工具。 FireBug允許您從JavaScript控制檯執行這將有所幫助的命令。希望舊網站沒有一堆<FONT>,<OBJECT><IFRAME>標籤,這將使這更加乏味。

使用像Prototype或JQuery這樣的庫也有助於選擇你需要的網站的部分。您可以提交使用JQuery結果是這樣的:

$(function() { 
    snippet = $('#content-id').html; 
    $.post('http://myserver/page', {content: snippet}); 
}); 

一個問題,你很可能會碰上的是「同一起源政策」,許多瀏覽器執行JavaScript的。因此,如果您的JavaScript是從​​加載的(如本例中所示),那麼您就可以。

也許你可以採用的另一種方法是使用Ruby,Python或VBA等腳本語言(如果你真的有耐心的話)。該腳本可以自動化頁面列表進行刮取,併爲信息提供目標位置。如果頁面得到更新,就可以輕鬆地將其打包爲新服務器的請求。這樣你就不用擔心注入JavaScript並希望所有的工作都沒有問題。

+1

或者也許只是在頭中使用'javascript:'URL指令?即'javascript:alert(「hello」);' – Qix 2010-12-17 21:08:33

1

我想你需要油猴http://www.greasespot.net/

+1

我同意,油猴腳本將繞過同源問題。只需將該網站加載到Firefox中,然後運行腳本來擦除HTML。 HTML抓取可能非常棘手,但 – 2010-12-17 21:22:54