2016-12-16 70 views
0

您好,我需要從NCBI網頁中的蛋白質頁面提取功能表格。頁面示例如下: https://www.ncbi.nlm.nih.gov/protein/Q8TB36.3使用Python從NCBI頁面(JS)提取表格

我在Python 3.x中編寫腳本,使用BeautifulSoup包獲取頁面的html。問題是,如果我下載這個頁面的html源碼,我沒有得到功能表 - 功能表是由JavaScript生成的? 有沒有辦法,如何調用該腳本並自行生成Feature表?或者如何從頁面提取所需的數據?

感謝您的建議

回答

0

中的JavaScript從這個網址獲取數據:

https://www.ncbi.nlm.nih.gov/sviewer/viewer.fcgi?id=269849682&db=protein&report=genpept&extrafeat=984&fmt_mask=0&retmode=html&withmarkup=on&tool=portal&log$=seqview&maxplex=3&maxdownloadsize=1000000 

您可以請求此URL,並獲得您需要的數據。

您可以在Chrome開發工具中找到此網址。