data-manipulation

    1熱度

    3回答

    lists = [["a", 1], ["b", 2], ["c", 3]] 有沒有辦法按特定值刪除列表中的列表? 例如,我想刪除列表[「B」,2]通過指示刪除其中包含2

    1熱度

    1回答

    下面的圖片顯示了DOB的不同格式,將它們格式化爲dd/mm/yyyy的最簡單方法是什麼?右邊的日期是正確的,但是左邊的日期是回到前面,並且所有單個數字缺少0。

    0熱度

    1回答

    我有兩個數據幀 數據幀a a A 1 4 7 b B 2 5 8 c C 3 6 9 數據幀b a A 10 13 16 b B 11 14 17 c C 12 15 18 我希望創建一個新的數據幀c保留了前兩個a的列,並將第3列的相應數字元素添加到5. 我用下面的代碼: c<-data.frame(matrix(NA, nrow=3, ncol=5)) for (i in 1

    2熱度

    1回答

    我首先在垂直方向生成一些數據,但是想將它們轉換爲行數據,然後將它們像熊貓數據框一樣堆疊到一個數組中。我如何獲得4欄('fr','en','ir','ab')和三行熊貓數據框的最終產品? # coding=utf-8 import pandas as pd from pandas import DataFrame, Series import numpy as np import nltk

    1熱度

    2回答

    我對SAS編程相對比較陌生,但在過去幾個月中我一直在提高基礎知識,並滿足了我的需求。但是,我目前有麻煩,希望得到一些幫助。我正在嘗試更新數據庫並創建兩個新變量,以幫助跟蹤更新。所以,我已經簡化我的問題如下表: 源表 ID Record_ID Correction_ID 0001 A001 0002 A002 0003 A003 A001 0004 A004 A002 0005

    0熱度

    2回答

    我不知道如何搜索我所追求的內容,因此這可能是一個重複的問題。如果是這樣,提前抱歉! 我有一系列的患者(數據框「招生」)和一系列事件(第二個數據框稱爲「事件」)招生。 我對入場後5天內是否發生事件感興趣。顯然必須在患者ID('id')內進行匹配。 在現實生活中,入學數據框包含100k分的大於500k的入學資格。一名患者可能有多次入院和多次事件。並非所有的患者都會有事件發生。 admissions <

    0熱度

    1回答

    我有一個包含896個SNP in a genome行的數據集。然後我有一個來自特定創始人的每個SNP的概率值。創始人分成8個組。 我想檢查每個SNP概率,如果最大值具有平局,請檢查每組8個創始人中的最高值並查看它是否重複。我只對雙向關係感興趣。然後,我想獲得領帶的價值,它出現的SNP以及哪些創始人擁有它。 的問題是,我在所有的創始人組在列旁邊重複對方用這樣的佈局方式給我的數據: SNP P1_1

    0熱度

    1回答

    我有幾個位置的某些商業活動的開始和結束時間。該事件可能會或可能不會發生在每一天,事件持續時間不會重疊。 location start end 1 x 2010-01-01 08:28:00 2010-01-01 13:25:00 2 x 2010-01-02 07:20:00 2010-01-02 10:09:00 3 y 2010-01-01 10:22:00 2010

    2熱度

    2回答

    我想根據dplyr中某些值的百分比排名創建一些組。 下面的代碼創建一個數據框,然後用sapply函數來確定組。缺點是我無法得到安樂死,只爲數據幀tbl_postgres工作。所以我很好奇,如果有另一種解決方案。 我已經考慮過一些事情了,但是我想創建的組有一些任意的截斷點。另外,我沒有太多的運氣讓它與dplyr一起工作(也許純sql可能會起作用)。 library(dplyr) n <- 100

    2熱度

    1回答

    我試圖使用Rcharts跨多個記錄區域(彼此堆疊單獨的組值)創建堆疊條形圖。數據的格式與下面類似。 Region | Group | Value ---------------------- USA | A | 5 USA | B | 3 USA | C | 1 UK | A | 4 UK | B | 6 France | C | 3 使用下面的代碼產生一個分組條形圖,它工作