閱讀文本文件當我使用R,我能讀懂它們包含在一個文件夾一次性許多文本文檔。 但是,我剛開始學習Python。當我使用命令:file = open('c:/txt/Romney', 'r')
,試圖打開包含在羅姆尼文件夾中的所有文本文件,我發現我要讀內文用一個文件中的一個,我不能閱讀所有一次性就像我在河做什麼建議嗎?文本挖掘:在Python
回答
在像Python語言,你需要使用一個for
循環在時間閱讀每個文件的內容之一。
(相關:How to list all files of a directory in Python)
from os import listdir
from os.path import isfile, join
path = "C:/txt/Romney"
files = [ f for f in listdir(path) if isfile(join(path,f)) ]
for file in files:
with open file as f:
text = f.read()
do_something_with(text)
除了戴夫Yarwood的回答,如果你真正想要做的是串聯的文件,你可以用做:
from os import listdir
from os.path import isfile, join
from itertools import chain
path = "C:/txt/Romney"
files = [open(f) for f in listdir(path) if isfile(join(path,f))]
for line in chain(*files):
do_something_with(line)
(只爲了好玩,因爲我從來沒有用過itertools.chain
串起來文件之前)
你不應該再對文件的文件做':file.close()'? –
而不會是'[f.open()對於F中...'? –
@DaveYarwood當對象被垃圾收集時,文件會自動關閉。而'listdir'只是返回一個字符串列表,而不是文件句柄。字符串沒有「開放」方法。 –
- 1. 使用Python進行文本挖掘
- 2. Python,文本挖掘,docx到表(CSV)
- 3. 中文文本挖掘
- 4. python數據挖掘
- 5. [R文本挖掘問題
- 6. stemDocument [R文本挖掘
- 7. 文本挖掘中的R
- 8. 挖掘維基百科映射文本挖掘關係
- 9. 的Oracle SQL導航數據挖掘文本挖掘
- 10. 文本挖掘單個文本文檔
- 11. Kmeans聚類和文本挖掘在R
- 12. R採用量化的文本挖掘
- 13. 如何文本挖掘特定數據
- 14. BeautifulSoup文本挖掘 - 變量字符串
- 15. 如何數據挖掘文本?
- 16. 文本挖掘和機器學習
- 17. 帶r庫的文本挖掘stringdist
- 18. 文本挖掘與R:使用子
- 19. UIAlertView如果CCMenuItemFont(文本)挖掘
- 20. 電子郵件的文本挖掘
- 21. 創建詞彙辭典文本挖掘
- 22. 存儲文本數據挖掘的
- 23. 文本挖掘/相似論壇
- 24. 取代R中data.frames(文本挖掘)
- 25. 使用PHP進行文本挖掘
- 26. 文本挖掘與斯卡拉
- 27. 文本挖掘中的功能數
- 28. 文本挖掘庫或語言庫?
- 29. 文本挖掘中的矩陣控制
- 30. 從文本中挖掘位置
你所說的「一次性」是什麼意思?你想連接它們嗎?或者一個一個迭代它們? –
我很好奇R是如何做到的。這種行爲聽起來像R試圖猜測你可能想要做什麼 – MxyL
發佈你試圖在Python中模擬/複製的R代碼會有幫助。 – hrbrmstr