我想獲取網站'https://xxxxxx/login.htmx'的內容。在HTML代碼中有一個JS腳本是這樣的:Python - 使用Javascript登錄表單
<script language="javascript">$(document).ready(function() {
$('#BTN_ACCEDI').linkbutton({plain:false});
$('#BTN_ACCEDI').click(function(){customSubmitLogin();});
$('#j_password').validatebox({required:true,validType:'length[1,80]' });
$('#j_username').validatebox({required:true,validType:'length[1,80]'});
$('#imp_num').validatebox({required:true,validType:'length[1,5]'});
$('#j_username').focus();
});</script>
搜索,所以我已經發現了一些線索,把我帶到這個:
payload = {'j_username':'______',
'j_password':'______',
'imp_num':'_____'}
url = 'https://xxxx/login.htmx'
s = requests.Session()
r = s.post(url, data=payload)
但是當我嘗試r.text
它給了我原始的html頁面,而不是登錄後的頁面。
你能幫我嗎?知道成功登錄後的URL是否相同有用嗎?
請提供一個最小的,但工作的例子。 – linusg
對不起,我不明白你的工作示例是什麼意思。 使用我提供的代碼,我無法提取html內容。我可以添加什麼? –
我的意思是進口等。如果您使用的'requests.Session()'來自標準庫或不是! – linusg