2016-01-25 26 views
0

我正在處理Google Cloud Dataflow中的信息,我們試圖使用JPA將數據插入或更新到我們的mysql數據庫中,但是這些查詢在我們的服務器上大喊大叫。所以我們決定改變我們的路徑...如何在Java Maven中生成mysqldump腳本?

我想生成一個mysql或.sql文件,所以我們可以編寫通過數據流處理的新信息。我想知道是否有這樣做的實施方式,還是我必須自己做這件事?

讓我再解釋一下,我們有一個來自XML的輸入,我們將信息處理成java類,我們有一個json數據庫轉儲,所以我們可以看到我們在線沒有做這麼多的調用,考慮到這一點,我們將新的信息與我們已有的信息進行比較,並決定它是新的還是僅僅是一個更新。

如何通過Java/Maven執行此操作?我需要代碼來生成此文件...

+0

歡迎來到SO。詢問關於教程或框架的問題是堆棧溢出的焦點話題。考慮更新你的問題,併發布你有maven的問題並生成一個mysql轉儲。 – Marcinek

回答

2

是的,雲數據流在許多機器上並行處理數據。因此,其他服務可能無法跟上或某些配額受到衝擊並不令人驚訝。

根據您的具體使用情況,您可以在不改變方法的情況下減慢/限制Dataflow。可能會限制工作人員數量,限制並行性,使用IntraBundleParallelization API等。總體而言,這可能是更好的途徑。我們也在研究更加明確的方法來節制數據流。

現在,任何系統都不可能爲您的數據庫自動生成.sql文件。但是,使用像ParDoTextIO.Write這樣的基元通過Dataflow流水線生成這樣的文件應該非常簡單。

+0

謝謝,這是非常有用的,我們正在使用一個ParDo做Query生成...我希望文件看起來更像是一個SQL轉儲,但我的合作伙伴說這應該工作得很好,並且您的其他評論可能對我們其餘的工作有用! –