pandas

0熱度

2回答

由於我的Python代碼變得越來越長，我想將它分成不同的文件以便更好的組織。在同一個文件夾，我創建2個文件 'firstfile.py' 和 '2ndfile.py' 下面是 'firstfile' 的代碼 import pandas as pd df=pd.DataFrame({'a':[2,4],'b':[2,1]}) 下面是 '2ndfile' import firstfile

0熱度

1回答

熊貓數據框中，彙總並把數據在下一列

我有一個這樣的數據集： Country Name Match Result US Martin Win 3 US Martin Lose 1 US Martin Draw 5 UK Luther Win 5 UK Luther Draw 3 我想補充兩列從勝利和結果，失去和Draw，和百分比每場比賽是這樣的： Country Name Match Result Al

2熱度

3回答

如何爲pandas multiindex數據框中的每個子索引添加一行？

假設我有以下數據框： import pandas as pd df = pd.DataFrame( { 'state': ['CA', 'WA', 'CO', 'AZ'] * 3, 'office_id': list(range(1, 7)) * 2, 'sales': [pd.np.random.randint(100000, 999999) for

4熱度

1回答

查找符合python中特定條件的重複項

下面是我正在處理的示例數據。 sender receiver date id salman akhtar 20161201 1111 akhtar salman 20161201 1112 nabeel ahmed 20161201 1113 salman akhtar 20161201 1114 salman akhtar 20161202 1115 nabeel ahmed 201

5熱度

1回答

使用Pandas將JSON列寫入Postgres .to_sql

在ETL進程中，我需要將JSON列從一個Postgres數據庫提取並加載到另一個PostgreSQL數據庫。我們使用Pandas來做這件事，因爲它有很多方法可以讀取和寫入不同來源/目的地的數據，所有的轉換都可以使用Python和Pandas編寫。我們對老實說的方法很滿意......但我們遇到了問題。通常讀取和寫入數據相當容易。您只需使用pandas.read_sql_table即可讀取源數據和p

1熱度

1回答

合併兩個數據幀，同時保持一定的排

我的目標我想合併的同時保持連續兩個數據幀，row_to_keep 數據幀 >>> df ColumnA Stats 0 Cake 872 1 Cheese Cake 912 2 Egg 62 3 Raspberry Jam 091 4 Bacon 123 5 Bread 425 row_to

1熱度

1回答

從一個數據框添加列到python中的分組數據框

我在Python中有兩個數據框。第一個是一年中單日的原始降雨數據，第二個是使用group.by的每日降雨總和。一個數據幀看起來像這樣（有更多的排在device_ids之間）： >>> df1 device_id rain day month year 0 9z849362-b05d-4317-96f5-f267c1adf8d6 0.0 31 12 2016 1

1熱度

1回答

pandas groupby /應用程序的性能下降

我在調用groupby和申請熊貓數據框（比使用純python慢100倍以上）時注意到性能很慢。我的數據是一系列不同的長度，但固定的嵌套深度嵌套列表，我轉換成數據幀通過添加列的列表索引： import pandas as pd from random import randint # original data data1 = [[[[randint(0, 10) for i in ra

1熱度

2回答

在python

替換列值。這是希望的人一個簡單的問題在那裏：我有一個數據幀，看起來像這樣： import pandas as pd names_raw = { 'device_id': [ '1d28d33a-c98e-4986-a7bb-5881d222c9a8','54322099-e76d-4986-afd2-0861e2113a16','ec3a9f9d-8e4d-4986-bea8-c17

0熱度

1回答

在熊貓堆積條形圖與最大值而不是求和

我想複製在Excel數據透視表中完成的工作。我有3個變量（空閒時間，總時間和客戶）。我想製作一個疊加（重疊）的條形圖，但不是所有變量的總和。例如：如果.. Total_time = 10 Idle_time = 3 我想柱狀圖顯示的空閒時間爲每一個客戶的最大值和總時間。到目前爲止，當我嘗試使用stacked = True時，它只是將空閒時間疊加在一起並創建一個最大值爲10 + 3 = 1