Apache Beam：FlatMap vs Map？

2017-08-14 102 views 5 likes

我想了解在哪種情況下我應該使用FlatMap或Map。 The documentation對我來說似乎不太清楚。Apache Beam：FlatMap vs Map？

我仍然不明白在哪種情況下我應該使用FlatMap或Map的轉換。

有人能給我一個例子，所以我可以理解他們的區別嗎？

我明白FlatMap的VS地圖Spark中的差異，但不知道是否有任何相似之處嗎？

來源

2017-08-14 EmmaYang

回答

Beam中的這些轉換和Spark（斯卡拉）完全相同。

甲Map變換，從N個元素的PCollection映射成N個元件的另一PCollection。

甲FlatMap變換映射的N個元素到零個或多個元件，其然後壓平成單個PCollection N個集合的PCollections。

一個簡單的例子，發生以下情況：

beam.Create([1, 2, 3]) | beam.Map(lambda x: [x, 'any']) 
# The result is a collection of THREE lists: [[1, 'any'], [2, 'any'], [3, 'any']]

鑑於：

beam.Create([1, 2, 3]) | beam.FlatMap(lambda x: [x, 'any']) 
# The lists that are output by the lambda, are then flattened into a 
# collection of SIX single elements: [1, 'any', 2, 'any', 3, 'any']

來源

2017-08-14 21:01:24 Pablo

Pablo-明白了。感謝您的詳細解釋和示例。 :) – EmmaYang

您可以接受的答案，如果它是適當的：） – Pablo

優秀解釋+1 – codebrotherone

相關問題

1. Map vs Map <K,V>
2. MultiKeyMap vs. Map with Map values
3. Apache Spark：map vs mapPartitions？
4. Guava MultiSet vs Map？
5. Img map vs canvas
6. mongodb：group VS map-reduce VS aggregation
7. Spring-ws VS Apache cxf VS Apache Axis2 VS Metro
8. map vs hash_map in C++
9. Angular2 RxJs Observables：filter vs map？
10. Apache Spark vs Apache Ignite

11. MongoDB - DBRefs vs Map/Reduce vs手冊參考
12. 在Hazelcast中存儲json vs Object vs Map。
13. Apache Spark vs Apache Spark 2
14. STL priority_queue <pair> vs. map
15. Apache vs Twisted
16. cloudera manager vs Apache
17. Velocity vs Apache Tiles
18. Netty vs Apache MINA
19. Apache Velocity $ vs $！{}
20. Apache Flink：MapPartition VS. FlatMap
21. Postfix vs. Apache James
22. Apache Helix vs YARN
23. Apache-ssl vs mod_ssl
24. LiteSpeed vs Apache httpd
25. OpenAdaptor vs Apache Camel
26. XSOM vs Apache XmlSchema
27. apache to tomcat：mod_jk vs mod_proxy
28. Apache + mod_wsgi vs nginx + gunicorn
29. UnboundID vs Apache LDAP APIS
30. confluent platform vs apache kafka