pos-tagger

1熱度

1回答

之前您重定向我到另一個計算器頁面，因爲我知道有關於加快詞性標註了幾個問題，我已經通過瀏覽並加快了我的代碼這裏的建議：Slow performance of POS tagging. Can I do some kind of pre-warming? 我使用Python 3.6。我有包含約100,000個詞的列表已經使用nltk進行了標記。這些都是非常重要的名單，所以我知道標記所有這些單詞本質上需

0熱度

1回答

當調用NLTK SennaTagger的tag_sents（）方法時，列表索引超出範圍錯誤

IndexError: list index out of rangetag_sents() NLTK SennaTagger方法（http://www.nltk.org/_modules/nltk/tag/senna.html）被調用。給出了句子列表作爲tag_sents方法的輸入。需要阿森納的可執行文件運行惡搞。 SENNA工具包的安裝指南可以在這裏找到。 http://ronan.col

0熱度

2回答

random.shuffle（someLazyMap）

我目前正在嘗試訓練我的Python NLTK詞性標記器以正確標記德語文本。爲了做到這一點我使用的ClassifiedBasedGermanTagger，距離： https://github.com/ptnplanet/NLTK-Contributions/tree/master/ClassifierBasedGermanTagger ，並從該網站訓練語料庫： http://www.ims.uni-

0熱度

1回答

StanfordCoreNLP錯誤：未找到此類訓練過的標記器配置文件

我正在使用StanfordCoreNLP庫（stanford-corenlp.jar），並且在執行下面幾行代碼時出現錯誤。 protected StanfordCoreNLP pipeline; public LemmatizerHelper() { Properties props; props = new Properties(); props.put("an

2熱度

1回答

俄語的現代依賴分析器

俄語是否有任何現代的詞性標記器+依賴分析器？我需要一個工具或服務，將能夠處理純文本輸出：劃分成句子劃分爲令牌部分的語音標籤（細粒度MSD標籤歡迎）引理（鹼型）依賴角色標籤我需要爲商業目的的工具。它可以是一個具有訓練有素的統計模型的開源項目，可用於商業目的（如果需要購買）或Web API。最終，它可能是專有模型的專有閉源二進制文件。俄羅斯的解析模型比我在網上找到的都要求使用Tree

-1熱度

1回答

問題在培訓方面Maltparser型號

我努力訓練的Bangla有Maltparser模型。我註釋了Conllu格式的一個小語料庫。但它給了我空指針錯誤。所以我嘗試了從UD網站收集的一些樹庫。它適用於這些數據集。我的問題是我就可以訓練Maltparser型號不XPOSTAG，我已經詮釋了UPOSTAG場和XPOSTAG場只是UPOSTAG的副本。我需要註釋XPOSTAG嗎？這是我的樹庫和UD之間的唯一區別樹庫因爲它是爲評估目的我可以

1熱度

1回答

在Java中使用POSTagger在不同的文件中保存不同的POS（詞類）？

我正在使用openNLP標記POS（詞性）。 InputStream inputStream = new FileInputStream("C:/en-pos-maxent.bin"); POSModel model = new POSModel(inputStream); POSTaggerME tagger = new POSTaggerME(mod

8熱度

3回答

如何申請pos_tag_sents（），以大熊貓數據幀有效

在你想POS標籤存儲在大熊貓數據幀，每行1句大部分實現文本列上SO的情況下使用的應用方法 dfData['POSTags']= dfData['SourceText'].apply( lamda row: [pos_tag(word_tokenize(row) for item in row]) NLTK文檔recommends using the pos_tag_sents()

1熱度

1回答

使用NLTK創建pos標籤語料庫

我想使用NLTK構建pos標籤語料庫。這樣我就可以根據它來訓練我的模型。到目前爲止我已經提到很多來源，但每個人只是解釋如何閱讀你的標註語料和閱讀單詞，句子等，以下是一段代碼，我想： from nltk.corpus.reader import TaggedCorpusReader reader = TaggedCorpusReader('/home/abc/nltk_data/', 'pos_

1熱度

2回答

以實施順序排在第一位：POS標記或Lemmatisation？

如果我想製作一個像NLTK這樣的NLP工具包，那麼在標記化和標準化後我會首先實現哪些功能。 POS標籤或Lemmatisation？