-1
Spark-cassandra-connector-java和Spark SQL DataFrame apis中使用Spark 1.5.1,篩選出長度小於或大於給定長度的字符串列的最佳方法是什麼?如何根據列的長度減少/過濾Spark DataFrame(Java)中的列?
我試圖做這樣的事情
DataFrame df = context.sql("select key from mytable where key is not null")
DataFrame fdf = df.filter(functions.length(df.col("key").gt(10))))
如何進行的functions.length(列)API的工作?它需要一個Column並返回一個Column,但是長度會發生什麼?
謝謝。這非常有幫助。我在這個[link] {https://docs.datastax.com/en/datastax_enterprise/4.8/datastax_enterprise/spark/sparkSqlSupportedSyntax.html}處提到了DataStax文檔,並沒有看到那裏列出的LENGTH關鍵字/函數。兩種方法都可以工作,但我已經簡化了這篇文章的例子,所以我需要使用的是帶有過濾器功能的例子。 – Joe