我正在使用nltk,因此我想創建自己的自定義文本,就像nltk.books上的默認文本一樣。不過,我剛剛起牀的方法類似如何在NLTK中標記字符串句子?
my_text = ['This', 'is', 'my', 'text']
我想發現任何方式輸入我的「文本」爲:
my_text = "This is my text, this is a nice way to input text."
哪種方法,python的或允許NLTK我這樣做。更重要的是,我該如何低估標點符號?
你能否澄清一下,你這是什麼意思'低估punctation symbols'? – quetzalcoatl 2013-02-25 14:01:33
我想他的意思來標記輸入句子 – alvas 2013-02-25 14:03:33
呀,比如如果我這樣做: sentente =「這是我的句子,句子很短的表達式」 所以,「句子」和「一句」會兩個不同的元素... – diegoaguilar 2013-03-02 18:15:55