2012-10-22 64 views
3

我想使用NLP工具從意大利文文本中提取名稱和數字。意大利的命名實體識別

不幸的是,The Standford NLPApache OpenNLP都不能爲意大利語提供模型。

我可以找到一個,或找到一個培訓數據? (至少15000個句子)

+1

你可以試試[l'enciclopedia libera](http://it.wikipedia.org/wiki/Pagina_principale)。 –

回答

4

Italian Content Annotation Bank有一些NER註釋的數據。雖然不確定大小。至於數字,我認爲一個簡單的基於規則的方法可以做到這一點。

相關問題