我正在嘗試一個小程序來下載網頁並收集一些數據。 該程序適用於大多數網頁。但是,下載Twitter搜索結果存在問題。 下載程序似乎只獲得微博主頁。我正在使用WinInet進行下載。下載twitter搜索頁時出現問題
注意到Twitter使用「#!」在其網址。 (www.twitter.com /#!/ ......)。這是否與此有關?
感謝有關如何處理此問題的任何建議。
感謝
我正在嘗試一個小程序來下載網頁並收集一些數據。 該程序適用於大多數網頁。但是,下載Twitter搜索結果存在問題。 下載程序似乎只獲得微博主頁。我正在使用WinInet進行下載。下載twitter搜索頁時出現問題
注意到Twitter使用「#!」在其網址。 (www.twitter.com /#!/ ......)。這是否與此有關?
感謝有關如何處理此問題的任何建議。
感謝
只要刪除hashbang,它會沒事的。但是,使用API更合適。
您可能成爲緩存的受害者,特別是在URL中使用#。試試INTERNET_FLAG_RELOAD |對於HttpOpenRequest或InternetOpenURL中的dwFlags,INTERNET_FLAG_NO_CACHE_WRITE(忽略緩存並從網絡重新加載|不要爲緩存寫入響應)。 你也可以嘗試URLEncoding#。
爲什麼被標記爲「C++」?聽起來像wget + bash腳本的完美工作,或者Perl和Perl :: curl ...? – 2011-06-15 22:20:28