R - 如何以編程方式獲取研究文章的引用次數？

對於R中的數據挖掘研究文獻，是否有辦法檢索文章的引用次數（假設我有pmid，doi或其他文章標識符）？R - 如何以編程方式獲取研究文章的引用次數？

2014-12-02 daj

Pubmed有大量的引文記錄??? （我對此持懷疑態度。）您能否提供關於該功能文檔的鏈接？ – 2014-12-02 22:24:28

我不一定非得使用pubmed/rismed來獲取這些信息。任何我可以用r查詢的數據庫都沒問題 – daj 2014-12-02 22:37:00

你能舉一個你迄今爲止做過的例子嗎？我認爲這可能很困難。 ISI Web of Knowledge不想被刮，[谷歌學者不想被刮，不方便提供信息]（http://bmb-common.blogspot.ca/2011/11/google- scholar-still-sucks.html）......我想可能會有一些基於Scopus的工具可以工作...... – 2014-12-02 22:39:12

嗯...我想出了這一點：

#imagine the DOI is : 10.1097/PAI.0b013e3181ecaf1c 
#so for google you need to substitute '/' for %2F 

doi <- "10.1097/PAI.0b013e3181ecaf1c" 
doi2 <- gsub("/", "%2F", doi) 
thepage = readLines(paste('http://scholar.google.com.br/scholar?q=', doi2, sep="")) 

theDOI <- thepage[grep(paste('doi:', doi, "|Cited by", thepage)] 
citedBy <- gregexpr("Cited by", theDOI) 

n_of_citations <- lapply(1:length(theDOI), function(x){ 
    substr(x=theDOI[[x]], start=citedBy[[x]], stop=citedBy[[x]]+10) 
}) 


#usualy on google the first match is the correct result search... so.. 
n_of_citations[[1]] 

[1] "Cited by 23"

是基於谷歌的結果。然而，並非所有的結果都有引用數字，並不總是谷歌的第一個結果是正確的結果...

來源

2014-12-03 02:36:34

順便說一下，這個DOI是我讀過的最後一篇論文......大聲笑 – 2014-12-03 02:38:34

R - 如何以編程方式獲取研究文章的引用次數？

回答

相關問題