2014-12-02 38 views
1

對於R中的數據挖掘研究文獻,是否有辦法檢索文章的引用次數(假設我有pmid,doi或其他文章標識符)?R - 如何以編程方式獲取研究文章的引用次數?

+0

Pubmed有大量的引文記錄??? (我對此持懷疑態度。)您能否提供關於該功能文檔的鏈接? – 2014-12-02 22:24:28

+0

我不一定非得使用pubmed/rismed來獲取這些信息。任何我可以用r查詢的數據庫都沒問題 – daj 2014-12-02 22:37:00

+2

你能舉一個你迄今爲止做過的例子嗎?我認爲這可能很困難。 ISI Web of Knowledge不想被刮,[谷歌學者不想被刮,不方便提供信息](http://bmb-common.blogspot.ca/2011/11/google- scholar-still-sucks.html)......我想可能會有一些基於Scopus的工具可以工作...... – 2014-12-02 22:39:12

回答

1

嗯...我想出了這一點:

#imagine the DOI is : 10.1097/PAI.0b013e3181ecaf1c 
#so for google you need to substitute '/' for %2F 

doi <- "10.1097/PAI.0b013e3181ecaf1c" 
doi2 <- gsub("/", "%2F", doi) 
thepage = readLines(paste('http://scholar.google.com.br/scholar?q=', doi2, sep="")) 

theDOI <- thepage[grep(paste('doi:', doi, "|Cited by", thepage)] 
citedBy <- gregexpr("Cited by", theDOI) 

n_of_citations <- lapply(1:length(theDOI), function(x){ 
    substr(x=theDOI[[x]], start=citedBy[[x]], stop=citedBy[[x]]+10) 
}) 


#usualy on google the first match is the correct result search... so.. 
n_of_citations[[1]] 

[1] "Cited by 23" 

是基於谷歌的結果。然而,並非所有的結果都有引用數字,並不總是谷歌的第一個結果是正確的結果...

+0

順便說一下,這個DOI是我讀過的最後一篇論文......大聲笑 – 2014-12-03 02:38:34

相關問題