我有一句話'現在對於完全不同的東西'。我想標記它,標記並將其存儲到Excel文件中以供進一步處理。
<pre>sent = "And now for something completely different" words = nltk.word_tokenize(sent) tags = nltk.pos_tag() print tags</pre>
在Excel中寫一個清單
上面的結果是帶有嵌套列表格式的標籤的單詞。
[('And', 'CC'), ('now', 'RB'), ('for', 'IN'), ('something', 'NN'), ('completely', 'RB'), ('different', 'JJ')]
我想這個結果列表存儲到一個Excel文件,在一列文字和標籤其他。
我試着通過下面的代碼來實現上述目的。
fd = open("output.txt",'w')
i=0
for words in tags:
for word in words:
i+=1
fd.write(word)
if i==1:
fd.write('\t')
fd.write('\n')
i=0
上述代碼將字和標籤完美地寫入輸出文件。如果我使用shutil方法從文本文件複製到excel格式,它將完美執行。當我嘗試閱讀轉換時出現問題。我收到以下錯誤。
XLRDError: Unsupported format, or currupt file: Expected BOF record; founf 'And\tCC\n'
誰能告訴我,我該怎麼寫標記列表輸出文件,這樣我上面的錯誤能解決嗎?
如何使用shutil從文本複製到excel格式?你知道excel格式不只是文件擴展名(.xlsx)。這意味着文件的內容應該以特殊的方式組織起來,以便Excel應用程序知道如何閱讀它。一般來說,您可以使用[xlsxWriter](https://pypi.python.org/pypi/XlsxWriter)模塊,也可以使用[CSV]編寫文件(https://en.wikipedia.org/wiki/Comma-separated_values )格式,然後在Excel中導入它。 –