2013-07-21 156 views
1

假設我下載許多HTML頁面的目錄如何轉換html鏈接?

/路徑/要/我的/目錄

的html的網頁包含類似的鏈接:

"<a href="http://www.example.com/lessons/firstlesson.htm">first lesson</a>" 

"<a href="http://www.example.com/lessons/secondlesson.htm">second lesson</a>" 

感謝TobSpr ,答案轉換如下:

"<a href="/path/to/my/dir/firstlesson.htm">first lesson</a>" 

"<a href="/path/to/my/dir/secondlesson.htm">second lesson</a>" 

UPDATE

,但如何處理這種格式的鏈接: 「第一課」

"<a href="../index.htm">index</a>" 

使用通常的字符串函數是非常困難的,骯髒和越野車,所以我希望得到另一個尤爲明顯辦法 。

+0

難道你不能只使用Notepad ++或類似的查找/替換?編寫腳本似乎沒有必要。 –

+0

這樣做對於每個頁面中的很多很多鏈接是不可能的... – tabebqena

+0

爲什麼?大部分編輯器都可以在多個文件中替換字符串的所有實例。事實上,Notepad ++可能會以比Python更強大的方式來實現這一點。 –

回答

1
content.replace("http://www.example.com/", "file///path/to/dir/") 

它也取代了包含的路徑。

+0

感謝您的時間,我編輯了這個問題。 – tabebqena