2017-04-21 40 views
0

我正在尋找在android應用中使用java sdk進行文本處理並將其放在某些類別下的那些。 但我看到corenlp java sdk大小是371MB(3.7.0版本),這在android應用程序中是不可行的,因爲大小比這個小得多,並且不能承擔更多的應用程序大小。 是否有可能只有nlp的子集可用?standford corenlp java sdk for android

回答

0

你能描述一下你想用斯坦福CoreNLP做什麼嗎?你需要多大的規模才能把事情做好?您可以刪除一些代碼和資源,但刪除的功能越多,您將失去的功能越多。

更新:要記住的東西,代碼和依賴關係是〜10 MB。大多數350+ MB是僅在運行時需要的資源。如果你只使用一個子集,你肯定可以減少10MB。

難道你不能把資源放在允許高達4 GB的擴展文件中。您仍然可以刪除一些不必要的資源。

雖然另一個嚴重的問題是,Android應用程序似乎有一個小的RAM限制。 30 MB以下的內存使用量可能會很有挑戰性。

+0

我們主要考慮處理用戶輸入的文本,並嘗試將整個文本分類到一個類別中,因此這裏可能會使用一些文本挖掘算法。那麼對於這個特定的任務,是否有辦法從371MB獲取代碼和資源的一個子集,並且最終的sdk(jar或aar)大小是30-40 MB還是更少?在這裏我想將SDK集成到android應用程序中,所以不知道如何使用擴展文件。 – user1174114

+0

我認爲你可能會遇到很多麻煩。但是,您可以選擇幾個班級和必要的資源,只使用這些班級而不是完整的371 MB。您將不得不編譯所需類的代碼子集,並從各個jar中提取必要的資源。源代碼在GitHub上可用:https://github.com/stanfordnlp/CoreNLP – StanfordNLPHelp