pandas

    1熱度

    1回答

    我正在尋找相當於R的mutate,它允許您在創建它們之後立即引用已定義的變量在相同的mutate調用內。 new_df <- old_df %>% mutate(new_col = ifelse(something, 0, 1), newer_col = ifelse(new_col == 0, 'yay', 'nay')) 在python熊貓中尋找等價物。 如果我創建

    1熱度

    1回答

    我有這樣的數據集, PRODUCT_ID SALE_DATE SALE_PRICE PROVIDER 1 01/02/16 25 1 1 02/10/16 60 1 1 01/11/16 63 2 1 09/10/16 65 3 2 11/11/15 54 1 2 13/01/16 34 2 3 19/05/14 45 1 3

    0熱度

    1回答

    廣泛地說,我有來自Kaggle的智能量表數據集,我試圖按房子計算第一個和最後一個量度,然後嘗試聚合以查看有多少房屋開始(或結束)報告給定的一天。我接受的方法完全不同於我在下面追求的路線。 在SQL中,探索數據時,我經常使用類似以下內容: SELECT Max_DT, COUNT(House_ID) AS HouseCount FROM ( SELECT House_ID, MAX(Da

    0熱度

    2回答

    我有一個SQL數據庫,它有兩列。其中有時間戳,其他保存數據以JSON格式 例如DF: ts data '2017-12-18 02:30:20.553' {'name':'bob','age':10, 'location':{'town':'miami','state':'florida'}} '2017-12-18 02:30:21.101' {'name':'dan','age

    1熱度

    4回答

    我需要使一些名稱格式匹配稍後在我的腳本中進行合併。我列「名稱」是從CSV導入幷包含類似名稱如下: 安東尼布朗 萊西恩·麥考伊 萊夫翁·貝爾 對於我的劇本,我想獲得第一個名字的第一個字母,並與姓氏結合起來這樣.... A.Brown L.McCoy L.Bell 這裏是我已經把現在返回一個烤餅每次: ff['AbbrName'] = ff['Name'].str.extract('([A-Z]\s[

    1熱度

    1回答

    我有從CSV文件導入多個時間序列數據。 這些數據都有時間戳,但時間戳並不總是一致的: 時間系列1: UUT Data DateTime 2017-11-21 18:54:31 uut1 1 2017-11-22 02:26:48 uut1 2 2017-11-22 10:19:44 uut1 3 2017-11-22 15:11:28 uut1 6 201

    1熱度

    2回答

    我有熊貓系列棗myS import pandas as pd 該指數是一組包含時間字符串的唯一 myS.index Out[28]: Index([u'12:00 AM', u'12:14 AM', u'12:18 AM', u'12:25 AM', u'12:26 AM', u'12:37 AM', u'12:41 AM', u'12:47 AM', u'12:55 AM'

    1熱度

    1回答

    我有一個名爲time的datetime列的Pandas數據框。我想計算每小時的行數。問題是,我希望生成的表格處理幾小時不存在行。例如: time id lat lon type 0 2017-06-09 19:34:59.945128-07:00 75 36.999866 -122.058180 UPPER CAMPUS 1 2017-06-09 19:53:56.387058-07:00 7

    1熱度

    1回答

    我有一個包含YYYY-MM-DD('arrival_date')形式的時間序列(作爲索引)的熊貓數據幀和I我想每個星期一到星期天都要分組,以便計算其他列的平均值,中位數,標準偏差等等。我最終應該只有七行,到目前爲止我只知道如何按周分組,每週彙總一切。 # Reading the data df_data = pd.read_csv('data.csv', delimiter=',') # P

    0熱度

    1回答

    我有對象類型的這樣的柱: quote['SellTime'].head() Out[32]: 0 94520 1 94538 2 94609 3 94615 4 94617 Name: SellTime, dtype: object 我想將其轉換爲對日期時間(datetime64 [NS])格式。 我也做了下面的代碼: quo