我是Python的新手,我很困惑所有這些數據類型,如系列,數組,列表等。這可能是一個非常開放的問題。我希望在使用python進行數據分析編碼時能夠了解一般實踐。如何處理熊貓和numpy在一起的系列和數組?
大量的讀數表明,numpy和pandas是我需要進行數據分析的兩個模塊。然而,我發現它很難操作/生成兩種不同數據類型的數據,即Series和Array。在進行任何類型的數據操作之前,需要將任何一種數據類型轉換爲另一種數據類型是否正常/自然?希望你知道你會做什麼?非常感謝。
例如:
import pandas as pd
import numpy as np
# create some data
df = pd.DataFrame(np.random.randn(10, 3), columns=['a', 'b', 'c'])
x = np.random.randn(10, 1)
# data manipulation
A = df['a']
# Question 1:
# If I want to perform a element by element addition between x and A
# How should I do? Simple x + A doesn't work but it seems strange to
# me that if I have to convert the data type everytime
# Question 2:
# I'd like to combine to two columns together
# concatenate or hstack both don't work
你想獲得'numpy.arrays'或'pd.Series'和'pd.Dataframes'? –
我假設我想在數據框開始的時候結束數據框(因爲我使用熊貓導入數據)。基本上,我發現它們彼此不兼容(這兩個模塊)令人討厭,並且懷疑我是否處於正確的方向(幾乎每次操作都需要額外的步驟/功能)。 – Lafayette