2
我正在使用Jython在豬中編寫我的Python UDF,但是當我的UDF輸入很大時(即超過分配給我的JVM的內存),我遇到了內存問題。在Pig文檔中,諸如COUNT,MAX等函數通過使用代數和更重要的累加器接口來克服這個問題。 Accumulator接口允許Pig中的數據以塊的形式發送到UDF,這適用於我的問題。有沒有人有任何使用Jython做這件事的例子? (或將輸入流式傳輸到Python的任何想法)任何幫助將不勝感激! :)Apache Pig - Jython UDF內存錯誤