我想從Pubchem數據庫中提到的所有IUPAC名稱中建立一些長度的前綴和後綴列表,以便我可以在我的項目中進一步使用它們作爲特徵。因此,我希望所有IUPAC化學名稱都位於文本文件中或以某種格式提取這些列表。如何提取從Pubchem(NCBI)提供的數據中提到的所有IUPAC名稱到文本文件中?
Thanks.
我想從Pubchem數據庫中提到的所有IUPAC名稱中建立一些長度的前綴和後綴列表,以便我可以在我的項目中進一步使用它們作爲特徵。因此,我希望所有IUPAC化學名稱都位於文本文件中或以某種格式提取這些列表。如何提取從Pubchem(NCBI)提供的數據中提到的所有IUPAC名稱到文本文件中?
Thanks.
聽起來你需要像這樣Nist species list
您可以搜索大部分也是在Webbook,但我沒能找到下載鏈接配套。
在我們的實驗室中,我們得到了一個質譜數據庫的Cd(?),其中包含(完整的 - 好像它有250.000個物質)數據庫作爲文本文件。也許你可以通過一些供應商獲得。
該pubchem網站爲您提供通過ftp下載他們的數據轉儲。爲什麼不使用它?
該文本文件僅包含大約72,000個名稱,但我需要更多,因爲我的項目中使用的培訓文件包含的內容多於lakh.So請幫助我找到一種方法從Pubchem數據庫中提取名稱。 – kasharavi