pandas

    0熱度

    2回答

    由於我的Python代碼變得越來越長,我想將它分成不同的文件以便更好的組織。在同一個文件夾,我創建2個文件 'firstfile.py' 和 '2ndfile.py' 下面是 'firstfile' 的代碼 import pandas as pd df=pd.DataFrame({'a':[2,4],'b':[2,1]}) 下面是 '2ndfile' import firstfile

    0熱度

    1回答

    我有一個這樣的數據集: Country Name Match Result US Martin Win 3 US Martin Lose 1 US Martin Draw 5 UK Luther Win 5 UK Luther Draw 3 我想補充兩列從勝利和結果,失去和Draw,和百分比每場比賽是這樣的: Country Name Match Result Al

    2熱度

    3回答

    假設我有以下數據框: import pandas as pd df = pd.DataFrame( { 'state': ['CA', 'WA', 'CO', 'AZ'] * 3, 'office_id': list(range(1, 7)) * 2, 'sales': [pd.np.random.randint(100000, 999999) for

    4熱度

    1回答

    下面是我正在處理的示例數據。 sender receiver date id salman akhtar 20161201 1111 akhtar salman 20161201 1112 nabeel ahmed 20161201 1113 salman akhtar 20161201 1114 salman akhtar 20161202 1115 nabeel ahmed 201

    5熱度

    1回答

    在ETL進程中,我需要將JSON列從一個Postgres數據庫提取並加載到另一個PostgreSQL數據庫。我們使用Pandas來做這件事,因爲它有很多方法可以讀取和寫入不同來源/目的地的數據,所有的轉換都可以使用Python和Pandas編寫。我們對老實說的方法很滿意......但我們遇到了問題。 通常讀取和寫入數據相當容易。您只需使用pandas.read_sql_table即可讀取源數據和p

    1熱度

    1回答

    我的目標 我想合併的同時保持連續兩個數據幀,row_to_keep 數據幀 >>> df ColumnA Stats 0 Cake 872 1 Cheese Cake 912 2 Egg 62 3 Raspberry Jam 091 4 Bacon 123 5 Bread 425 row_to

    1熱度

    1回答

    我在Python中有兩個數據框。第一個是一年中單日的原始降雨數據,第二個是使用group.by的每日降雨總和。 一個數據幀看起來像這樣(有更多的排在device_ids之間): >>> df1 device_id rain day month year 0 9z849362-b05d-4317-96f5-f267c1adf8d6 0.0 31 12 2016 1

    1熱度

    1回答

    我在調用groupby和申請熊貓數據框(比使用純python慢​​100倍以上)時注意到性能很慢。我的數據是一系列不同的長度,但固定的嵌套深度嵌套列表,我轉換成數據幀通過添加列的列表索引: import pandas as pd from random import randint # original data data1 = [[[[randint(0, 10) for i in ra

    1熱度

    2回答

    替換列值。這是希望的人一個簡單的問題在那裏: 我有一個數據幀,看起來像這樣: import pandas as pd names_raw = { 'device_id': [ '1d28d33a-c98e-4986-a7bb-5881d222c9a8','54322099-e76d-4986-afd2-0861e2113a16','ec3a9f9d-8e4d-4986-bea8-c17

    0熱度

    1回答

    我想複製在Excel數據透視表中完成的工作。我有3個變量(空閒時間,總時間和客戶)。我想製作一個疊加(重疊)的條形圖,但不是所有變量的總和。 例如:如果.. Total_time = 10 Idle_time = 3 我想柱狀圖顯示的空閒時間爲每一個客戶的最大值和總時間。 到目前爲止,當我嘗試使用stacked = True時,它只是將空閒時間疊加在一起並創建一個最大值爲10 + 3 = 1