2011-01-14 60 views
5

在進行項目工作時,我需要下載和處理PubMed摘要的全文文章,是否有任何實現的代碼或工具允許用戶輸入一組PubMed ID並下載免費的完整版同樣的文章文章。任何形式的幫助或提示都非常感謝。PubMed文章全文PDF格式

回答

5

由於PubMed的性質,我不認爲這是可能的。您要做的最好的事情是從PubMedCentral的Open Access子集中獲取文章。 PubMedCentral有一個number of online utilities做這項工作。

+0

你會想用考研來PMC ID轉換器,以獲得您想要的PMCids,然後用自己的E-utils的像StompChicken說。 – 2011-01-16 16:06:17

+3

PubMed中引用的許多文章並非免費提供。即使您的圖書館擁有合適的訂閱,但下載它們也會帶來挑戰,因爲出版商並不知道您在考慮版權或許可證侵犯時並不這麼做。我的理解是,他們將阻止那個可能會導致整個校園關閉的尷尬後果的港口。文本挖掘是一種合法用途。聯繫您的發佈商。更好的是,支持您的開放獲取期刊。 – Chris 2011-09-13 15:06:29

3

StompChicken指出,發佈商在提交給PMC之前驗證其XML,因此它們不是用於下載的工具。

請注意,PMC中絕大多數文章並非開放式訪問(OA),因此無法通過任何方式自動(合法)下載。 NCBI警告:

  • PMC中的大多數文章受傳統版權限制,不屬於此子集。閱讀PMC版權聲明以獲取更多信息。
  • PMC OAI服務和PMC FTP服務是唯一可用於從此開放訪問子集自動下載文章的服務。
  • 禁止通過任何其他自動過程對物品進行系統檢索(批量下載),即使您僅從該子集檢索物品。
  • 某些期刊在發表時免費提供的文章使用「開放獲取」標籤,但仍受傳統版權限制。這些文章不是這個子集的一部分。

要下載PMC內容,最好的辦法是使用PMC開放存取FTP服務:http://www.ncbi.nlm.nih.gov/pmc/tools/ftp/

您還可以使用eutils查詢PMC和下載OA子集的全文以及http://eutils.ncbi.nlm.nih.gov/corehtml/query/static/efetchlit_help.html

另一種方法是使用OAI服務:其餘的摘要http://www.ncbi.nlm.nih.gov/pmc/tools/oai/

的OAI服務是可怕的記錄,但上手的一些技巧在這裏:http://www.biostars.org/p/2076/#13338

如果你想保持和更新PMC庫,嘗試pubtools:http://code.google.com/p/pubtools/