我在aws-lambda
中寫了一個函數。該功能很簡單。它只是從特定網站獲取請求。urllib2的結果與網絡瀏覽器的結果不同
python2中的Lambda函數如下所示。也包括import urllib2
。
def lambda_handler(event, context):
# TODO implement
url = "https://www.amazon.co.jp/s/field-keywords=4548967337259"
response = urllib2.urlopen(url)
#print response
return response.read()
我把返回值給我ruby on rails
服務器,並試圖解析了必要的信息。
在網站上,標籤和相關信息如下所示。
<a class="a-link-normal a-text-normal" target="_blank"
rel="noopener" href="https://www.amazon.co.jp/GOTHAM-
%E3%82%B5%E3%83%BC%E3%83%89-%E3%82%B7%E3%83%BC%E3%82%BA%E3%83%B3-
%E3%83%96%E3%83%AB%E3%83%BC%E3%83%AC%E3%82%A4-
%E3%82%B3%E3%83%B3%E3%83%97%E3%83%AA%E3%83%BC%E3%83%88-
%E3%83%9C%E3%83%83%E3%82%AF%E3%82%B9-Blu-ray/dp/B071K5VZTL/ref=sr_1_1?
ie=UTF8&qid=1505293516&sr=8-1&keywords=4548967337259">
但是,如果我拿response
和使用read()
方法來傳輸,它看起來像這樣。
<a class=\"a-link-normal a-text-normal\" target=\"_blank\" rel=\"noopener\"
href=\"https://www.amazon.co.jp/GOTHAM-%E3%82%B5%E3%83%BC%E3%83%89-
%E3%82%B7%E3%83%BC%E3%82%BA%E3%83%B3-
%E3%83%96%E3%83%AB%E3%83%BC%E3%83%AC%E3%82%A4-
%E3%82%B3%E3%83%B3%E3%83%97%E3%83%AA%E3%83%BC%E3%83%88-
%E3%83%9C%E3%83%83%E3%82%AF%E3%82%B9-Blu-ray/dp/B071K5VZTL\">
爲什麼會發生這種情況,我該如何避免這種情況?
其實我想是這樣response.json()
但無法作出json
形式完全。
你能解釋一下用頭,沒有它的區別? –
@ jh.shin你可以「欺騙」服務器,認爲你是一個Web瀏覽器。沒有它似乎它會爲您提供不同的內容。 –