我有一個關於分塊阿拉伯文本的項目 我想知道是否可以使用NLTK來提取阿拉伯文本的塊,NP,VP,PP以及如何使用阿拉伯語語料庫。 請任何人幫助我!使用nltk分塊阿拉伯文本
1
A
回答
1
它遠非完美(很大程度上是因爲阿拉伯語的語言屬性與英語的語言屬性顯着不同),但a computer science student developed an Arabic language analysis toolkit in 2011看起來很有希望。他開發了「一個由詞性標註器和形態分析器組成的綜合解決方案,該工具包在古典阿拉伯語上進行了培訓,並在現代標準阿拉伯語的示例文本上進行了測試。」我認爲這個工具的侷限性在於訓練集是經典的,而測試集是MSA。
該論文是一個很好的開始,因爲它解決了現有的工具及其相對的成功(和缺點)。我也強烈推薦this 2010 paper這看起來像一個傑出的參考。它是also available as a book in print or electronic format。
此外,作爲個人筆記,我希望看到一位母語爲NLP的人士使用Google ta3reeb(可作爲Java open source utility)開發更好的工具和庫。只是我的一些想法,我對阿拉伯語NLP的實際經驗非常有限。有很多公司開發了應用阿拉伯語NLP原則的搜索解決方案,儘管他們的許多工作可能是專有的(例如,我知道Basis Technology有worked with this相當廣泛;我不以任何方式隸屬於Basis我也沒有去過)。
相關問題
- 1. 阿拉伯文文本框
- 2. 使用WebClient閱讀阿拉伯文本
- 3. 阿拉伯語文本框
- 4. Parse Json阿拉伯文本
- 5. 使用NLTK令牌化阿拉伯語詞彙
- 6. 印刷阿拉伯文文本文件
- 7. Winforms阿拉伯文輸入文本框
- 8. Tokenize阿拉伯語文本文件java
- 9. 阿拉伯文文本對齊
- 10. 使用wkhtmltopdf製作阿拉伯文PDF
- 11. 在android中使用阿拉伯文字
- 12. 用阿拉伯語
- 13. 阿拉伯文字分解爲兩部分,使用Javascript
- 14. 正常化阿拉伯語文本mysql
- 15. Java中的阿拉伯語文本AWT
- 16. queryString包含多行阿拉伯文本
- 17. 阿拉伯文本多個結果
- 18. 文本到阿拉伯語的語音
- 19. Break阿拉伯文字體
- 20. Pdflib6阿拉伯文連字
- 21. 顯示阿拉伯文字
- 22. 如何阿拉伯文文本轉換使用PHP
- 23. 如何在PHP中使用cURL發佈阿拉伯文文本?
- 24. 使用pdfbox創建阿拉伯語文本pdf文件
- 25. Jquery自動完成分割阿拉伯語文本
- 26. 使用Zebra打印機打印阿拉伯文本[ZPL]
- 27. 使用itextsharp在c#中提取阿拉伯語文本
- 28. 如何使用TBXML解析器獲取阿拉伯語文本?
- 29. 使用Python快速翻譯阿拉伯語文本
- 30. 使用R的阿拉伯語文本挖掘
我可以生成我自己的Speach部分嗎?或者我可以使用標記文字... – dooja 2013-05-08 08:58:00