我正在尋找一種方法來從不同頁面下載文件,並將它們存儲在本地計算機中的特定文件夾下。我使用Python 2.7從Filetype字段下載文件?
見下面的字段:
編輯
下面是HTML內容:
<input type="hidden" name="supplier.orgProfiles(1152444).location.locationPurposes().extendedAttributes(Upload_RFI_Form).value.filename" value="Screenshot.docx">
<a style="display:inline; position:relative;" href="
/aems/file/filegetrevision.do?fileEntityId=8120070&cs=LU31NT9us5P9Pvkb1BrtdwaCrEraskiCJcY6E2ucP5s.xyz">
Screenshot.docx
</a>
一個方法可行我只是想:與HTML的內容,如果加說https://xyz.test.com
和構造URL類似如下
,並將該網址到瀏覽器和命中Enter
讓我有機會來下載文件提到的截圖。但是現在我們能找到這樣的數值嗎?
CODE我試過至今
只有痛苦如何下載該文件。使用構建的腳本URL:
for a in soup.find_all('a', {"style": "display:inline; position:relative;"}, href=True):
href = a['href'].strip()
href = "https://xyz.test.com/" + href
print(href)
請幫我這裏!
讓我知道你們是否需要我提供更多信息,我很樂意將這些信息告訴你們。
在此先感謝!
你是什麼意思的不同頁面?這些頁面是從哪裏渲染的? – Amyth
@Amyth我正在使用第三方「URL」。我正在使用'selenium'在網頁中瀏覽頁面,搜索任何可下載的文件,如果找到,然後將它們下載到特定的文件夾中。我有這樣的10000個文件下載。 –
你能發佈完整的HTML嗎? – Amyth