2013-09-05 103 views
0

我在我的項目中使用Gate來實現自然語言處理模塊。在下一步中,我希望系統支持多個用戶。每個用戶都有不同的域名詞組(我把它寫入地名詞典)。據我所知,門使用了大量的靜態資源,創建門的多個實例非常困難。有沒有人有任何想法與門實施多租戶?GATE的多租戶

非常感謝你提前。 PS:我使用門的原因是因爲它有jape規則。如果你能夠引入其他工具,這很容易定製,並且也有這種基於規則的語法,那將是非常好的。

回答

1

答案取決於你如何使用gate應用程序。在我的想法下面,我假設位於其他PR(即Tokenizer,Gazetteer,JAPE規則)之間的用戶域地名錄。

a)您可以使用Java代碼中的門應用程序。如果是,則可以根據用戶標識符將地名錄刪除/插入SerialAnalyzerController。你可以在內存中創建一個Map map(如果地名詞不太大),並且根據當前的USER_ID在執行之前從SerialAnalyzerController添加/刪除PR。

b)您使用門應用程序,但不想有情景1.然後您可以編寫一個處理資源,根據用戶標識將使用指定的地名詞典。地圖可以在PR初始化階段創建。 在PR「執行」方法中,您可以獲取用戶標識符(例如從文檔特徵),然後使用適當的地名詞典。

c)嘗試使用條件語料庫PR。不知道這是否是最好的解決方案,但猜測它可以工作。

+0

謝謝你的好主意。在將其標記爲答案之前,我會嘗試實施。 –