2016-09-22 16 views
-1

謝謝你停下來。我無法從這裏拉出usersessionid。我正在使用python seleium。我歡迎每一個asnwer。 這是網頁的網址。用python硒拉文字

http://www.barneys.com/product/etq-amsterdam--22low-3-22-leather--26-jacquard-sneakers-504720152.html

`<script charset="utf-8" type="text/javascript"> 

     var apiKey= "dbeab3c977a08905", 
      clientApiKey = "8ed86f73d8296e2c", 
      environment="recs", 
      userSessionID= "N5pPRdoSPKl1D7LjwRyqiemXrMy6JWbn65PjU7XsMgQC68XuZsCl!778638265!763427-prodapp2!20580!-1!1474503760402", 
      userID= "73558799", 
      rrDown = false, 
      rrFlag = true; 

     var richRelevance = { 

      init: function(){ 
       try{ 
        if(typeof r3_common === 'function'){ 
         window.R3_COMMON = new r3_common(); 
+0

你看起來是垃圾郵件語言標籤 - 爲什麼?請修改您的問題並僅使用相關標籤。 –

+0

以及我提出的代碼有javascript,並且即時通訊使用python selenium來試圖拉動 –

+0

它與Java有什麼關係?你也標記了這種語言。瞭解標籤可以提高您對問題的關注度,但是錯誤標籤可能會增加負面關注。 –

回答

1

在這種情況下,它會好起來的擁有它使用正則表達式提取:

import re 

from selenium import webdriver 


driver = webdriver.Chrome() 
driver.get("http://www.barneys.com/product/etq-amsterdam--22low-3-22-leather--26-jacquard-sneakers-504720152.html") 

print(re.search(r'userSessionID\s*=\s*"(.*?)",', driver.page_source).group(1)) 

打印p2tPvuezfq3hjHKxe8kIA5JU7b0wRt4dy8Y-L7Bm8PvKv17DiH8X!-603204638!763426-prodapp1!20680!-1!1474511693747

+0

即將嘗試。謝謝你的回答 –

+0

工作完美!非常感謝 –