假設我有以下DOM結構以網頁 <html>
<body>
<div id="id1">Hello, this is div 1</div>
<div>This is div 2</div>
<div>And, this is div 3</div>
</body>
</html>
正如你可以看到,第一div具有ID1,但第二div的id
我知道我可以做UUID.randomUUID.toString來爲我的Dataset中的每一行附加一個ID,但是我需要這個ID是一個Long,因爲我想使用GraphX。我如何在Spark中做到這一點?我知道Spark有monotonically_increasing_id(),但那僅適用於DataFrame API - 數據集的情況如何?