data-manipulation

    1熱度

    4回答

    可以說你有這樣一個數組:String[] theWords = {"hello", "good bye", "tomorrow"}。我想刪除/忽略數組中具有字母'e'的所有字符串。我會怎麼做呢?我的想法是: for (int arrPos = 0; arrPos < theWords.length; arrPos++) { //Go through the array for (int

    7熱度

    3回答

    好的,我想用一個高效優雅的解決方案(如data.table或dplyr)來解決這個問題。 定義: DT = data.table(group=c(rep("A",3),rep("B",5)),value=c(2,9,2,3,4,1,0,3)) time group value 1: 1 A 2 2: 2 A 9 3: 3 A 2 4: 1 B 3 5: 2

    -1熱度

    2回答

    特定列的條件子矩陣我要選擇基於原有data矩陣的某些列的條件子矩陣x7992。具體而言,原矩陣是23166乘9,遵循原始高斯碼 x7992 =selif(data,data[.,col_coh].==0 .and data[.,col_year].<=1992); 我在MATLAB與 x7992 = data(data(:,col_coh)==0 & data(:,col_year)<=199

    0熱度

    2回答

    我有一個數據幀,寬度爲40列,長度爲300萬。每個單元格可以包含一個值,或者缺失。每行至少有幾個單元格填充。我有興趣找到那些包含任何以「M」開頭並具有「3」作爲第六個字符的值的行。我最大的問題是如何處理這個給出的數據幀的大小... n=40*300000 # 300k already takes long, let alone 3M! data <- data.frame(matrix(past

    -2熱度

    1回答

    我有一個數據,如在以下幾點: df col1 col2 col3 0 0 1 1 0 0 ,我希望得到的結果,其列的值爲1,並返回每個行中說列名給我。在考慮列的每一行中,只有一個「1」。還有其他的值會比1大得多。如果不用僅有的三列創建新的數據副本,我想知道是否有有效的方法來提取列名。

    1熱度

    1回答

    獲取我的測試數據: import pandas as pd df = {'Id': {1762056: 2.0, 1762055: 1.0}, 'FillDate': {1762056: Timestamp('2015-08-01 00:00:00'), 1762055:Timestamp('2015-08-01 00:00:00')}, 'Date': {1762056: nan, 17

    0熱度

    1回答

    在renderRHandsontable({})生成的使用數據是我想什麼來實現 數據<一個圖式 - read.csv( 「data.csv」) output$table1 <- renderRHandsontable({ data <- data*2 data_table <- filter(data, "ID1") rhandsontable(data_table)}) output$

    -1熱度

    1回答

    我有類似下面的虛擬數據集的輸入數據集: date time userid channel transaction 20161012 12:00:00 1 seo 0 20161018 16:50:00 1 referral 1 20161011 09:20:00 2 sea 0 20161020 12:20:00 2 direct 0 20161020 20:40:00

    0熱度

    1回答

    所以我有這個代碼,我試圖將名爲grade prek-12的單獨列合併到一個名爲Grade的列中。我已經使用了tidyr包,使用下面這行代碼來執行該任務: unite(dta, "Grade", c(Gradeprek, dta$Gradek, dta$Grade1, dta$Grade2, dta$Grade3, dta$Grade4, dta$Grade

    1熱度

    2回答

    試想一下,我們有行的大文件,如下所示 ID value string 1 105 abc 1 98 edg 1 100 aoafsk 2 160 oemd 2 150 adsf ... 說該文件名爲file.txt的,由製表符分隔。 我想保留每個ID的最大值。預期的輸出是 ID value string 1 105 abc 2 160 oem