1
做了我的研究,但沒有發現任何內容。我想一個簡單的pandas.DataFrame
轉換爲火花數據幀,這樣的:將Pandas Dataframe轉換爲Pyspark中的Spark Dataframe的TypeError
df = pd.DataFrame({'col1': ['a', 'b', 'c'], 'col2': [1, 2, 3]})
sc_sql.createDataFrame(df, schema=df.columns.tolist())
我得到的錯誤是:
TypeError: Can not infer schema for type: <class 'str'>
我試過的東西更簡單:
df = pd.DataFrame([1, 2, 3])
sc_sql.createDataFrame(df)
我獲得:
TypeError: Can not infer schema for type: <class 'numpy.int64'>
有什麼幫助嗎?手動需要指定一個架構左右嗎?
sc_sql
是一個,我在一個python 3.4和火花1.6 jupyter筆記本。
謝謝!
我試了代碼工作正常,沒有錯誤。 – shivsn
它不適合我,有或沒有模式... – neocortex
您使用哪種火花版本? – shivsn