我對使用Google雲數據流很陌生。我想獲得兩個PCollections的Cartesian產品。例如,如果我有兩個PCollections (1, 2)
和("hello", "world")
,它們的笛卡爾積是((1, "hello"), (1, "world"), (2, "hello"), (2, "world"))
。如何獲得兩個PCollections的笛卡爾積
任何想法,我可以做到這一點?此外,由於笛卡爾產品可能很大,我希望解決方案會懶惰地創建產品,從而避免大量的內存消耗。
謝謝!
關於你想要做什麼,你有更多的細節嗎?每個PCollections有多大?有幾種方法可以實現這個目標,哪一個更好取決於你想要的笛卡爾產品的原因和實際的PCollections。 –
這兩個PCollections是相同的。它們都包含大約100,000個類型爲'(String,String)'的元組。我正在使用英語單詞詞典並獲得他們的語音轉錄以便生成2個單詞的雙關語,例如:「fantasti-CAL-ifornia」。 –
對於直接的笛卡爾解決方案,[this](http://stackoverflow.com/a/41051283/377366)似乎是現在可用的最佳答案。 – KobeJohn