我正在嘗試將文件讀入我的python程序並在其上應用tokenizer將文本分成一組句子。然而,在我的輸出中,我得到了'/ n'字符,我想避免在輸出中,因爲它可能會妨礙我對句子的進一步處理。 我使用read()命令讀取輸入。還嘗試了readline()。我仍然在輸出中獲得換行符。任何建議,避免這種情況?格式化從Python中的文件輸入
file_sent = open(path,'r')
all_sents = file_sent.read()
sent_all = print all_sents
tokenized_sents = sent_tokenize(sent_all)
「\ n」是換行符的文本符號。 – Shakakai
我知道,但我不希望它在我的輸入。 – madCode
該代碼不應運行。 'sent_all = print all_sents'行會導致「無效的語法」錯誤。你在做什麼來完成這項工作? –