2014-01-26 152 views
-1

我對狀態感到困惑。網址在網址中的前綴

我下載HTTP頁面:// tukaani.org/xz/format.html,並希望按照HREF在HTML,但是,鏈接像 < A HREF =「XZ-文件格式1.0 .4.txt「> 指向http:// tukaani.org/xz/xz-file-format-1.0.4.txt而不是http:// tukaani.org/xz-file-format-1.0.4。文本'。

我怎麼能得到的URL的前綴,它不是主機名或基地,我找不到任何有用的信息在頭,有沒有字符串像'http:// tukaani.org/xz/'在標題。但任何瀏覽器都知道鏈接。

什麼是內部機制。如何在'http:// tukaani.org/xz/format.html'中使用wget,curl或perl獲取前綴'http:// tukaani.org/xz/'?

+1

HTTP是協議其他選項的文件: // ftp://和https://然而,在你的問題中存在一個極度缺乏清晰度的問題。 –

回答

0

這裏發生的是有兩種鏈接:絕對或相對。

你提到的是相對的,但相對於什麼?答案是:相對於當前頁面的URL,這樣以來你正在訪問http://example.com/xz/format.html的基本網址爲http://example.com/xz/

如果你訪問http://example.com/xz/another-sublevel/foo.html那麼「基地」將http://example.com/xz/another-sublevel/

正如你可能已經注意到,它的工作原理就像一個文件夾/文件結構,所以從相對鏈接開始,從當前網址的「文件夾」開始構建網址。

絕對鏈接將與/(文件夾樹結構中所謂的「根」)開始,所以如果你有<a href="/xz-file-format-1.0.4.txt">,任何頁面上,你會去http://example.com/xz-file-format-1.0.4.txt

+0

之間的空格謝謝,我明白了,我迷惑了href = /文件到href =文件 – SetupX