dataframe

    8熱度

    2回答

    我想統計數據幀中某些詞的出現次數。我知道使用「str.contains」 a = df2[df2['col1'].str.contains("sample")].groupby('col2').size() n = a.apply(lambda x: 1).sum() 目前我使用上面的代碼。有沒有一種方法來匹配正則表達式並獲得出現次數?在我的情況下,我有一個很大的數據框,我想匹配大約100個

    0熱度

    2回答

    我有一個看起來像這樣的金融數據的大數據幀: id Tradedate name hour open close 19897 2013-01-30 instrument1 1 18.01 13.50 19898 2013-01-30 instrument2 2 15.72 8.99 19899 2013-01-30 instrument3 3 12.80 11.42 19900 201

    0熱度

    1回答

    假設我有一個數據幀x和一個包含數據幀y和z的2個數據幀L的列表。 創建包含dfs x,y和z的第三個列表M的最佳方式是什麼? 我試過,但x的每列成爲M. M = c(x,L) 的元素我敢肯定有一些簡單的解決辦法,我在這裏失蹤。

    0熱度

    2回答

    我正在嘗試根據data.frame中包含的值重新設計和「擴展」data.frame。下面是我開始與數據幀的結構: 開始結構: 'data.frame': 9 obs. of 5 variables: $ Delivery.Location : chr "Henry" "Henry" "Henry" "Henry" ... $ Price : num 2.97 2.96 2.91 2.85

    1熱度

    2回答

    我有三個數據集。 組1: A B 23 12 34 81 13 45 11 23 組2: A B .34 1.1 .5 2.0 .4 1.8 設置3: A B -23 5 -3 0.1 .8 -2.3 -.6 1.4 4 3.2 現在我要創建一個數據幀作爲下面的類型: A B Typ

    0熱度

    2回答

    請允許我詳細說明。基本上,我有一個有4列的數據框,其中一列有NA。當NA發生時,它們總是以組的形式出現。我正在循環遍歷這個數據框,看着列。我想要做的就是儘快找到NA,我想在達到正常值之前,將該行的數據框與最後一次出現NA的行進行子集劃分。 因此,舉例來說,假設我們看看我的數據幀DF: C1 C2 C3 C4 C5 C6 R1 2 1 2 1 0 0 R2 2 2 1 1 0 0 R3 0 0

    44熱度

    6回答

    我有以下的數據幀: df = pandas.DataFrame([{'c1':3,'c2':10},{'c1':2, 'c2':30},{'c1':1,'c2':20},{'c1':2,'c2':15},{'c1':2,'c2':100}]) 或者,在人類可讀的形式: c1 c2 0 3 10 1 2 30 2 1 20 3 2 15 4 2 100 以下排序命令按預期工作: d

    1熱度

    2回答

    假設我有兩個數據幀: 數據幀1(我們稱之爲數據1):爲數據1 V1 V2 1 "AB" 3 "XY" 5 "DH" 8 "ST" 7 "RE" 代碼: V1 <- c(1,3,5,8,7) V2 <- c("AB","XY", "DH", "ST","RE") Data1 <- data.frame(V1,V2) 數據幀2(讓我們稱之爲本DATA2): V1

    0熱度

    2回答

    我有兩個數據幀 - 一個是巨大(超過200萬行)和一個較小(約30萬行)。較小的數據框是較大數據框的一個子集。唯一的區別是較大的有一個額外的屬性,我需要添加到較小的一個。 具體地,對於大的數據幀的屬性(日期,時間,地址,標誌)和用於小的數據幀的屬性(日期,時間,地址)。我需要以某種方式將正確的相應標誌值存入每行較小的數據幀中。 「合併」數據幀的最終大小應該與我的較小數據幀相同,從大數據幀中丟棄未使

    5熱度

    2回答

    我想生產從old大單(多變量)一new數據幀 我使用cbind.data.frame功能,它是這樣的 new <- cbind.data.frame(old$var1, old$var2, old$var3) str(new) 'data.frame': 100 obs. of 3 variables: $ old$var1 : num 爲什麼VAR1仍屬於old$? 我想用剛