pos-tagger

    1熱度

    1回答

    我有很棒的詞,如有趣,有趣,很棒,很好。我想檢查一下,如果單詞是形容詞或動詞,就像「愛」是動詞,而且是很好的形容詞...... 如何使用python或nltk做任何幫助?

    0熱度

    1回答

    您好,我正在嘗試使用Stanford Pos Tagger爲某個句子做POS標籤。我使用Python 3.4 NLTK 3.1 windows7的 以下是我使用的代碼: import nltk from nltk.tag.stanford import POSTagger import os java_path = r"C:\Program Files\Java\jre1.8.0_66\bi

    0熱度

    1回答

    我在Python中使用CRF POS Tagger,訓練英文PTB樣本語料庫,結果相當不錯。 現在我想用CRF來訓練一個大的越南語料庫。我需要添加一些越南的功能到這個標籤,如正確的名稱,日期時間,數字,...我試了幾天,但無法弄清楚如何做到這一點。我已經知道數據的格式,所以它不是問題。 我對Python很陌生。所以任何詳細的答案都可能有幫助。謝謝。

    1熱度

    1回答

    我有一個嚴重的問題:我已經下載NLTK 的最後一個版本,我得到一個奇怪的POS輸出: import nltk import re sample_text="start please with me" tokenized = nltk.sent_tokenize(sample_text) for i in tokenized: words=nltk.word_tokeniz

    0熱度

    1回答

    當我嘗試訓練一個有40K句子的語料庫時,沒有任何問題。但是,當我訓練86K的句子,我得到的錯誤是這樣的: ERROR:root: Traceback (most recent call last): File "CLC_POS_train.py", line 95, in main train(sys.argv[10], encoding, flag_tagger, k, p

    4熱度

    3回答

    喜文本挖掘冠軍, 我在Windows 10(客戶端環境)使用蟒蛇與NLTK V3.2 當我嘗試POS標記,我不斷收到一個URLLIB2錯誤: URLError: <urlopen error unknown url type: c> 看來urllib2無法識別Windows路徑?我該如何解決這個問題? 的命令也很簡單: nltk.pos_tag(nltk.word_tokenize("Hell

    0熱度

    1回答

    我學會使用polyglot爲POS標籤提供印度尼西亞文本。 import polyglot from polyglot.text import Text, Word text=Text("Menurut dia, Syahganda, dikenal sebagai penggiat isu-isu pertanahan serta perburuhan.") print text.pos

    0熱度

    1回答

    我在Python上使用NLTK。我想從txt讀取使用default,unigram和pos tagger。然而,我沒有這樣做,因爲沒有特定的txt導入標籤。例如,在課堂上,我們正在使用準備好的語料庫,比如棕色等。我的問題是如何使用標記符導入方法。最終,我希望看到評估每個標記器的性能。

    2熱度

    3回答

    我一直在做一些自然語言處理工作。 對於英文POS標記,它很簡單,因爲我只需要使用內置的nltk函數。我想同樣處理德語文本。 由於NLTK沒有德國內置的功能,我使用斯坦福POSTagger嘗試: from nltk.tag.stanford import StanfordPOSTagger import os import nltk java_path = "C:/Program Files/

    0熱度

    1回答

    我試圖在jsp中標記我的查詢。當我運行它作爲一個Java應用程序,它工作正常,但是當我運行它作爲jsp,我得到以下異常。 org.apache.jasper.JasperException: javax.servlet.ServletException: java.lang.NoClassDefFoundError: edu/stanford/nlp/tagger/maxent/MaxentTag