lapply(inspect(gsrc), write, filename, append=TRUE, ncolumns=1000)
meta(gsrc[[1]])
Available meta data pairs are:
Author :
DateTimeStamp: 2013-10-23 11:46:47
Description : BDliveShutdown Will ..........................
Heading : Shutdown Will Hinder True Gauge of US Economy - New York Times
ID :
救了我100的文本文檔webCorpus成一個單一的文件我保存到一個文件中,以便將讀取
cop <- Corpus(DirSource("/home/ashish/tm_web/23", encoding = "UTF-8"),readerControl = list(language = "lat"))
meta(cop[[1]])
Available meta data pairs are:
Author :
DateTimeStamp: 2013-10-23 11:38:20
Description :
Heading :
ID : ABC22.txt
Language : lat
Origin :
是否有可能(gsrc)或我是否必須保存元(gsrc [[1]])以獲取元數據的保存語料庫或我必須保存100文本文件才能獲得元(cop)作爲元爲了得到它,任何幫助,謝謝。
是否要保存所有的元標記或僅通過語料庫標記一些標記? – agstudy
@agstudy兩者都可以,但我只希望某些標記爲DateTimeStamp和Heading .thanks。 – Aashu