我正在使用Python將單詞文件轉換爲文本字符串。生成的文本字符串將Bullet點(在Word文件中)轉換爲(以轉換後的字符串形式)。我如何使用Python將其從文本字符串中刪除,這樣我只有沒有這些框()的文本字符串。從文本中刪除
from docx import Document
document = Document(file_to_read)
text_string = ''
for paragraph in document.paragraphs:
text_string += paragraph.text+"\n"# -*- coding: utf-8 -*-
print text_string
輸出是這樣的:
Computer Science fundamentals in data structures.
Computer Science fundamentals in algorithm design, problem solving, and complexity analysis
您正在使用哪種工具? Openpyxl用於Excel。 –
對不起。爲了閱讀我使用的word文件:docx。 –
@Kristof我添加了代碼。 –