2016-03-14 52 views
0

我有一個項目使DNorm軟件運行特定的文件格式(Pubtator)。我有XML文件,我想使用python將其更改爲pubtator格式,以使其可用於DNorm。pubtator格式使用python

Pubtator文件包含許多塊。每個Pubtator塊的格式如下: PMID | T | ArticleTitle PMID | A | AbstractText

PMID,ArticleTitle和AbstractText是在XML塊標記,而 'T' 和 'a'每次我們創建新塊時都是不變的。

我想幫助如何使用Python檢索XML標記值並將其存儲在Pubtator格式的新文件中。任何示例代碼或資源?

回答

0

做了一些谷歌研究後,似乎沒有標準的Pubtator解析器。所以我建議你徹底研究文本模式,併爲你的目的建立一個本地標準。但您可以參考this以供參考。它可以幫助你更好地理解Pubtator。