我試圖預測基於predictionio上其他文本字段的文本字段。我用this指南作參考。我創建使用預測評估失敗,文本分類模板
pio app new MyTextApp
一個新的應用和使用模板中提供的數據源遵循的指導高達評價。這一切都沒問題,直到評估。在評估數據源時,我在下面粘貼錯誤。
[INFO] [CoreWorkflow$] runEvaluation started
[WARN] [Utils] Your hostname, my-ThinkCentre-Edge72 resolves to a loopback address: 127.0.0.1; using 192.168.65.27 instead (on interface eth0)
[WARN] [Utils] Set SPARK_LOCAL_IP if you need to bind to another address
[INFO] [Remoting] Starting remoting
[INFO] [Remoting] Remoting started; listening on addresses :[akka.tcp://sparkDr[email protected]:59649]
[INFO] [CoreWorkflow$] Starting evaluation instance ID: AU29p8j3Fkwdnkfum_ke
[INFO] [Engine$] DataSource: [email protected]
[INFO] [Engine$] Preparator: [email protected]
[INFO] [Engine$] AlgorithmList: List([email protected])
[INFO] [Engine$] Serving: [email protected]
Exception in thread "main" java.lang.UnsupportedOperationException: empty.maxBy
at scala.collection.TraversableOnce$class.maxBy(TraversableOnce.scala:223)
at scala.collection.AbstractTraversable.maxBy(Traversable.scala:105)
at org.template.textclassification.PreparedData.<init>(Preparator.scala:152)
at org.template.textclassification.Preparator.prepare(Preparator.scala:38)
at org.template.textclassification.Preparator.prepare(Preparator.scala:34)
我必須編輯任何配置文件才能使其工作嗎?我已經成功地對movielens數據進行了測試。
感謝您的信息。我爲不同的數據集使用了相同的應用程序。我刪除了現有的應用程序,數據並創建了新的應用程序,然後運行pio構建,培訓和部署。現在它工作正常。 :) – cutteeth
真棒,我很高興的迴應幫助! 我剛剛發佈了一個新版本的引擎,其中包含一個完整性檢查,以確保訓練數據實際上被饋入。PreparedClass也被修改,以便文本向量化處理更快。 –
我已經下載了最新的文本分類模板(2.0),同樣的問題也在最近的更新中。評估失敗,錯誤爲'java.lang.UnsupportedOperationException:empty.maxBy',並且訓練失敗,發生'io.prediction.data.storage.DataMapException:字段標籤是必需的。'pio說spark地址綁定到loopback。我必須將其更改爲公共IP嗎?你也可以請解釋文本矢量化? – cutteeth