2014-02-10 155 views
0

我想修復一些關於urlparse.urljoin的情況。使用這種LIB像python urljoin目錄不包括

urljoin('http://xxxx.yyy/directory/','file.file') 

給我http://xxxx.yyy/directory/file.file,但如果我不網址最後給斜線狀

urljoin('http://xxxx.yyy/directory','file.file') 

給我http://xxxx.yyy/file.file這distrube我寫的自動採集程序。 任何人都可以有解決方案來解決這個問題。我試圖把斜槓,最後用正則表達式和替換,但是當URL完成像

http://xxxx.yyy/zzzz/file.file 

回答

0

它是正確的行爲,這些都不能正常工作。如果您使用的是http://example.com/index.html,然後點擊指向two.html的鏈接,則最終結果爲http://example.com/two.html。這就是相對URL被定義爲可以工作的方式。

urljoin無法知道最後一個組件是否是目錄。你可以嘗試猜測,也許通過尋找.,並且只有在你認爲它應該在那裏時才加上斜線。

+0

我知道urljoin工作正常。所以我也試圖檢查擴展名,但沒有擴展名的鏈接。感謝回答Eevee :) – user2547494