pos-tagger

    1熱度

    1回答

    之前您重定向我到另一個計算器頁面,因爲我知道有關於加快詞性標註了幾個問題,我已經通過瀏覽並加快了我的代碼這裏的建議:Slow performance of POS tagging. Can I do some kind of pre-warming? 我使用Python 3.6。我有包含約100,000個詞的列表已經使用nltk進行了標記。這些都是非常重要的名單,所以我知道標記所有這些單詞本質上需

    0熱度

    1回答

    IndexError: list index out of rangetag_sents() NLTK SennaTagger方法(http://www.nltk.org/_modules/nltk/tag/senna.html)被調用。 給出了句子列表作爲tag_sents方法的輸入。 需要阿森納的可執行文件運行惡搞。 SENNA工具包的安裝指南可以在這裏找到。 http://ronan.col

    0熱度

    2回答

    我目前正在嘗試訓練我的Python NLTK詞性標記器以正確標記德語文本。爲了做到這一點我使用的ClassifiedBasedGermanTagger,距離: https://github.com/ptnplanet/NLTK-Contributions/tree/master/ClassifierBasedGermanTagger ,並從該網站訓練語料庫: http://www.ims.uni-

    0熱度

    1回答

    我正在使用StanfordCoreNLP庫(stanford-corenlp.jar),並且在執行下面幾行代碼時出現錯誤。 protected StanfordCoreNLP pipeline; public LemmatizerHelper() { Properties props; props = new Properties(); props.put("an

    2熱度

    1回答

    俄語是否有任何現代的詞性標記器+依賴分析器? 我需要一個工具或服務,將能夠處理純文本輸出: 劃分成句子 劃分爲令牌 部分的語音標籤(細粒度MSD標籤歡迎) 引理(鹼型) 依賴角色標籤 我需要爲商業目的的工具。 它可以是一個具有訓練有素的統計模型的開源項目,可用於商業目的(如果需要購買)或Web API。最終,它可能是專有模型的專有閉源二進制文件。 俄羅斯的解析模型比我在網上找到的都要求使用Tree

    -1熱度

    1回答

    我努力訓練的Bangla有Maltparser模型。我註釋了Conllu格式的一個小語料庫。但它給了我空指針錯誤。所以我嘗試了從UD網站收集的一些樹庫。它適用於這些數據集。我的問題是 我就可以訓練Maltparser型號不XPOSTAG,我已經詮釋了UPOSTAG場和XPOSTAG場只是UPOSTAG的副本。我需要註釋XPOSTAG嗎?這是我的樹庫和UD之間的唯一區別樹庫 因爲它是爲評估目的我可以

    1熱度

    1回答

    我正在使用openNLP標記POS(詞性)。 InputStream inputStream = new FileInputStream("C:/en-pos-maxent.bin"); POSModel model = new POSModel(inputStream); POSTaggerME tagger = new POSTaggerME(mod

    8熱度

    3回答

    在你想POS標籤存儲在大熊貓數據幀,每行1句大部分實現文本列上SO的情況下使用的應用方法 dfData['POSTags']= dfData['SourceText'].apply( lamda row: [pos_tag(word_tokenize(row) for item in row]) NLTK文檔recommends using the pos_tag_sents()

    1熱度

    1回答

    我想使用NLTK構建pos標籤語料庫。這樣我就可以根據它來訓練我的模型。 到目前爲止我已經提到很多來源,但每個人只是解釋如何閱讀你的標註語料和閱讀單詞,句子等,以下是一段代碼,我想: from nltk.corpus.reader import TaggedCorpusReader reader = TaggedCorpusReader('/home/abc/nltk_data/', 'pos_

    1熱度

    2回答

    如果我想製作一個像NLTK這樣的NLP工具包,那麼在標記化和標準化後我會首先實現哪些功能。 POS標籤或Lemmatisation?