2013-10-18 81 views
-3

嘗試從HTML文件中打印提取的信息,變量「ac」存儲提取的內容(Nucleotide Id,例如:224589800),但函數退出而不打印變量。無法打印存儲HTML文件中提取值的變量

import re 
import urllib2 
def sr(): 
    a = raw_input('Enter Gene Id:') 
    b = int(a) 
    s = urllib2.urlopen('http://www.ncbi.nlm.nih.gov/gene/?term=s','r') 
    h = s.read() 
    s.close() 
    acc = re.search('gi=(.+?)&amp',h) #Extraction of Nucleotide Id from html file 
    if acc: 
      ac = acc.group(1) 
      print ac 
+0

我在該頁面的源代碼中沒有看到任何地方的'gi ='。有我們應該看的另一個URL嗎?或許是http://www.ncbi.nlm.nih.gov/nuccore/224589800? –

+0

我們有html文件 –

+0

check dis page http://www.ncbi.nlm.nih.gov/gene/?term=6323 – knwleq1byego

回答

0

您可能打算在各自的行中寫s = urllib2.urlopen('http://www.ncbi.nlm.nih.gov/gene/?term='+a,'r')。然後,當我輸入Gene ID時,它爲我工作:6232

您忘記將輸入傳遞給搜索功能。

+0

thx man you are correct it it worked – knwleq1byego