我通過wget在Windows下載一個HTML頁面及其文件。
wget -m -k -p -np --html-extension
wget特殊字符內部URL
這個html有很多特殊字符的url。
(例如:<a href="chp1_資料庫概論.doc" target="_blank">Chp1</a>
)
有2個問題:
- 內的HTML,網址(包括特殊字符的)變得有些亂語:
期望:
<a href="chp1_資料庫概論.doc" target="_blank">Chp1</a>
實際:
<a href="http://acupun.site/lecture/database/chp1_%B8%EA%AE%C6%AEw%B7%A7%BD%D7.doc" target="_blank">Chp1</a>
- 文件名是隨機的話。
可以通過添加--restrict-file-names=nocontrol
來解決seconed問題。
如何解決第一個問題?這是Windows版本的問題?
顯然,裏面的HTML,將其轉換網址有特殊字符的東西......