2017-02-03 46 views
-1

我已經在r中編寫了一個非常快速的高級腳本,以便與NCBI blast API進行交互。然而,有時候,結果url需要一段時間才能加載,我的腳本會拋出一個錯誤,直到url準備就緒。有沒有一種優雅的方式(即tryCatch選項)來處理錯誤,直到結果返回或在指定時間後超時?在r中等待結果或超時的循環

library(rvest) 
    ## Definitive set of blast API instructions can be found here: https://www.ncbi.nlm.nih.gov/staff/tao/URLAPI/new/BLAST_URLAPI.html 
    ## Generate query URL 
    query_url <- 
    function(QUERY, 
      PROGRAM = "blastp", 
      DATABASE = "nr", 
      ...) { 
     put_url_stem <- 
     'https://www.ncbi.nlm.nih.gov/blast/Blast.cgi?CMD=Put' 
     arguments = list(...) 
     paste0(
     put_url_stem, 
     "&QUERY=", 
     QUERY, 
     "&PROGRAM=", 
     PROGRAM, 
     "&DATABASE=", 
     DATABASE, 
     arguments 
    ) 
    } 

    blast_url <- query_url(QUERY = "NP_001117.2")  ## test query 
    blast_session <- html_session(blast_url)    ## create session 
    blast_form <- html_form(blast_session)[[1]]   ## pull form from session 
    RID <- blast_form$fields$RID$value  ## extract RID identifier 

    get_url <- function(RID, ...) { 
    get_url_stem <- 
     "https://www.ncbi.nlm.nih.gov/blast/Blast.cgi?CMD=Get" 
    arguments = list(...) 
    paste0(get_url_stem, "&RID=", RID, "&FORMAT_TYPE=XML", arguments) 
    } 
    hits_xml <- read_xml(get_url(RID)) ## this is the sticky part 

有時需要幾分鐘的時間get_url去住,所以我想什麼做的就是繼續努力,讓我們說每20-30秒,直到它產生的URL或超時預後指定時間。

回答