我想分割一個文本文件。它來作爲一個大段落。我想把它分成更小的句子,每個句子都是一個列表。從那裏我可以找出哪些列表包含特定的單詞。將文本段落拆分成句子
這是我的代碼,因爲它是目前:
import string
Done = False
while not Done:
try:
File = input("Enter your file: ")
Open_File = open(File, "r")
Info = Open_File.readline()
print(Info)
Open_File.close()
Done = True
except FileNotFoundError:
print("Sorry that file doesn't exist!")
Info_Str = str(Info)
Info_Str = Info_Str.lower()
Info_Str = Info_Str.replace("'", "")
Info_Str = Info_Str.replace("-", "")
Info_Str = Info_Str.split()
Info_List = Info_Str
Info_List = [''.join(c for c in s if c not in string.punctuation) for s in Info_List]
New_List = [item for item in Info_List if not item.isdigit()]
for word in New_List[:]:
if len(word) < 3:
New_List.remove(word)
print(New_List)
如果我把一個文本文件,它只返回一個文本文件的第一行字的列表。
如何將每個單獨的句子轉換爲單獨的單詞列表?提前致謝。
您確切的要求是什麼?如果您只想獲取文件中的單詞列表,則可以只讀取所有行並使用空格分隔符進行分隔。 – Geetanjali
我基本上必須找出哪個行號出現一個特定的單詞。每一行都是一個單獨的句子。 – Amaranthus
檢查我發佈的代碼段。這應該有所幫助。 – Geetanjali