multi-index

    1熱度

    1回答

    我有熊貓一個多指標,看起來像由下面的代碼生成一個: arrays = [[2001, 2001, 2003, 2004], ['January', 'March', 'June', 'December']] tuples= list(zip(*arrays)) index = pd.MultiIndex.from_tuples(tuples, names=['year', 'month'])

    1熱度

    1回答

    我有形狀2000x50的熊貓數據框「DF」,這將顯示爲: Col1 Col2 Col3 row1 0.046878 0.298156 0.743520 row2 0.442526 0.881977 0.885514 row3 0.075382 0.622636 0.706607 行列數沒有在我的真實的情景一致的命名。 我想創建一個多指數作爲一個數據幀: (row1, col1), 0

    1熱度

    1回答

    我想使用熊貓MultiIndex切片器命令.xs()來分割導入的csv文件(時間序列)並對其進行處理。以下df複製我導入的csv文件的結構。 import pandas as pd df = pd.DataFrame( {'Sensor ID': [14,1,3,14,3], 'Building ID': [109,109,109,109,109], 'Date/T

    2熱度

    2回答

    我需要乘以兩個具有相同最高級別索引的MultiIndexed幀(比如df1, df2),以便對於每個最高級索引,每行df1乘以每行元素爲df2。我已實現了以下的例子,我想要做什麼,但它看起來很醜陋: a = ['alpha', 'beta'] b = ['A', 'B', 'C'] c = ['foo', 'bar'] df1 = pd.DataFrame(np.random.randn(6

    1熱度

    1回答

    我有一個多指標數據幀: iterables = [['bar', 'baz', 'foo', 'qux'], ['one', 'two']] Index = pd.MultiIndex.from_product(iterables, names=['first', 'second']) s = pd.DataFrame(np.random.randn(8,2), index=Index)

    2熱度

    2回答

    我有一個數據幀,看起來是這樣的: A B C D 1 10 22 14 1 12 20 37 1 11 8 18 1 10 10 6 2 11 13 4 2 12 10 12 3 14 0 5 而且看起來是這樣的(注意的功能:它實際上是做一些更復雜,不能輕易分隔成三個獨立的電話,但我簡化爲清楚起見): def myfunc(g): return min(g), mean

    2熱度

    1回答

    我有兩個DataFrame。 df提供了大量的數據。 test_df描述某些測試是否通過。我只需要從df中選擇測試未失敗的行,只需在test_df中查找此信息即可。到目前爲止,我能夠將我的test_df減少到passed_tests。所以,剩下的就是隻選擇df的行,其中行索引的相關部分在passed_tests。我怎樣才能做到這一點? 更新: TEST_DB沒有不是唯一的行。哪裏有重複的行(可能有

    1熱度

    1回答

    index = [np.array(['foo', 'foo', 'qux']), np.array(['a', 'b', 'a'])] data = np.random.randn(3, 2) columns = ["X", "Y"] df = pd.DataFrame(data, index=index, columns=columns) df.index.names =

    2熱度

    2回答

    我有一個看起來像這樣的數據集,其中DATE和LETTER是多索引的。 我想返回每個日期的最大LETTER A VALUES的列表。 因此,在這種情況下,我想要返回VALUES 3和8。 VALUE DATE LETTER 1-2002 A 1 B 7 A 3 B 4

    6熱度

    2回答

    我有一個包含多索引的數據表。多指數的第一級是與給定序列(DNA)相對應的名稱,多指數的第二級對應於在下面的示例中的特定類型的序列變體wt,m1,m2,m3。並非所有給出的wt序列將具有所有類型的變體(參見下面的seqA和seqC)。 df = pd.DataFrame(data={'A':range(1,9), 'B':range(1,9), 'C': range(1,9)}, inde