1
我可以刮jquery對象嗎? 我其實想要從jquery對象中獲取所有的href鏈接。 我怎麼能做到這一點? 我剛剛在不到一週前從YouTube和互聯網上了解到Python網絡抓取。無法做到jQuery對象上刮href
url_1='http://ws.bursamalaysia.com/market/listed-companies/company-announcements/announcements_listing_f.html?_=1449326650932&callback=jQuery16208050466175191104_1449326525662&page_category=company&category=FA&sub_category=all&all_gm=&alphabetical=All&board=§or=&date_from=&date_to=&company=5218&page=&testing='
#Standard url request
req = urllib.request.Request(url_1, headers=headers)
resp = urllib.request.urlopen(req)
respData = resp.read()
soup = BeautifulSoup(respData, 'html.parser')
#soup.prettify()
pattern=re.compile("href")
links = soup.find_all(text=pattern)
print(links)
我仍然無法獲得所有鏈接。 它從\n
許多\\\n
返回。爲什麼會發生? 我應該將它們轉換爲字符串嗎?
我嘗試使用
links = soup.find_all('a')
print(links)
但它返回[]
。爲什麼?
我可以在正常的網頁中獲得href鏈接,但不能在jquery對象上獲得。
js_obj = json.loads(pat.search(r.content)。集團(1)) 類型錯誤:不能使用字符串模式在類似字節的對象上 – casual
我得到了上述錯誤。爲什麼有時會出現這個錯誤。是因爲我使用最新的python3.5嗎?我使用pycharm4.5免費版。 – casual
如何在此發佈代碼?'code' – casual