2017-03-16 31 views
0

我正嘗試使用biopython和python3自動下載pdbs。但是對於幾個pdbs,我遇到了404錯誤的問題。即使pdb退出,Biopython也無法下載文件

urllib.error.HTTPError: HTTP Error 404: Not Found 

一個例子,這就是它不能正常工作,但應該是:4YUU 數據庫PDB文件退出,我沒有看到的PDBS任何差異biopython下載。任何幫助,將不勝感激。

該代碼是用來:

import Bio 
from Bio.PDB import PDBList 
pdbl=PDBList() 
pdbl.retrieve_pdb_file('4YUU') 
+0

請顯示您的代碼 - 這將有助於解決問題以及向其他人展示您已努力自行解決此問題。 – cer

+0

對不起,我添加了它。代碼對我來說似乎太過基礎,不能共享。 – Mia

回答

0

爲4YUU的PDF格式的文件確實存在簡化版,,轉到http://www.rcsb.org/pdb/explore/explore.do?structureId=4YUU用於4YUU(從紅藻放氧光合系統II的晶體結構),並在兩者在「顯示文件」和「下載文件」菜單中,PDB格式條目變灰。

沒有尋找到這進一步我想這是一個非常大的蛋白質或有別的東西,不能在傳統的舊的基於文本PDB文件格式來表示。

嘗試通過該網站,該網站Biopython應該能夠解析下載PDBx/MMCIF文件來代替。

注意Biopython的下一個版本(這將是Biopython 1.69)有改變PDBList下載代碼來支持這一點。

+0

感謝您的解釋!這真的很有幫助。 :) – Mia