2012-07-31 95 views
0

當我通過我的Firefox 13訪問this網站時,我收到了一些內容。但是當我用wget下載它時:wget沒有返回正確的頁面

wget http://tinhvan.com 

我在下載的HTML頁面上獲得了其他內容。嘗試設置用戶代理:

wget -U 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:13.0) Gecko/20100101 Firefox/13.0.1' http://tinhvan.com 

但得到了相同的結果。

發生了什麼事?以及我如何獲得與通過Firefox訪問時相同的結果?

UPDATE

這裏是從Firefox =>視圖源:

<!DOCTYPE html> 

<html dir="ltr" lang="vi"> 

    <head id="ctl00_page_header"> 




      <title> 

       Tinhvan Group - Trang chủ  

和這裏從下載由wget的

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> 
<html xmlns="http://www.w3.org/1999/xhtml"> 
<head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /><link href="Content/images/main.css" rel="stylesheet" type="text/css" /><link href="Content/images/mail-detail.css" rel="stylesheet" type="text/css" /> 
    <script src="../../Content/JqueryUI/js/jquery-1.3.2.min.js" type="text/javascript"></script>  
    <title> 

    Trang chủ - Tinhvan Group Website 
+1

它會幫助顯示什麼'wget'返回 – CharlesB 2012-07-31 08:58:16

+0

我想我得到相同的結果。 – 2012-07-31 08:59:19

+0

@CharlesB:我更新了問題g – HVNSweeting 2012-07-31 09:18:45

回答

1

火狐(不只是FF,鉻,IE, etc也可以)自動添加Accept *標頭。

例如

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 
Accept-Encoding: gzip, deflate 
Accept-Language: en-US, en;q=0.5 

嘗試

wget --header="Accept: text/html" -U 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:13.0) Gecko/20100101 Firefox/13.0.1' http://tinhvan.com 

注意:如果你不接受申報,然後頭自動wget的增加接受:*/*,這意味着給我什麼,你有。看起來,該網站默認返回aplication/xhtml + xml,但您期望text/html。