dataset

    0熱度

    1回答

    我希望計算只有在值發生變化時記錄的時間序列數據集的平均值和標準偏差。 時間序列的間隔爲1秒,如果生成每個更改之間的缺失值,則存在數據集膨脹的風險。數據組類型的 實施例:[時代,值] [[152345235, 3], [152345335, 12], [152345835, 8]] 我們正在使用的清潔Python和聚集的數據。稀疏矩陣是不夠的,因爲它基於忽略不存在的0值。在研究方面,沒有任何證據

    0熱度

    1回答

    我正在導入一堆文件並嘗試將所有字符讀入一個變量。我需要保留這個命令。我在Stackoverflow上找到了我需要的代碼,但它在前面添加了0。所以而不是我的「0」 data <- "" 這仍然使我的數據變量在開始時留空白。我無法對它進行子集化並刪除所有「空白」,因爲我的輸入有一些需要保留在那裏。我怎樣才能刪除第一個空白「」或閱讀我所有的文件,而不必在那裏添加那個空白。 setwd("C:\\Us

    0熱度

    1回答

    如何將圖像轉換爲lmdb與咖啡fcn?你知道,用caffe很容易創建自己的圖像分類數據集,但是如何爲fcn創建自己的數據集語義片段?

    2熱度

    1回答

    我有一個源數據是這樣的: {A:123,B:"Hello world",C:[{D:123,E:"Spark"}]} ,我有一個對象: case class TestClass (A:Int;B:String;C:???) val obj:Dataset[TestClass] = df.as[TestClass] 我應該如何定義的類型C?

    1熱度

    2回答

    我需要SAS日期時間格式的幫助。 數據集(包括所需的列exp_dt): datetime valid exp_dt 4OCT2017:13.00.00 1 5OCT2017:13.00.00 4OCT2017:15.20.00 7 11OCT2017:15.20.00 6OCT2017:08.00.00 30 5NOV2017:08.00.00 所以,我需要

    0熱度

    1回答

    通過單擊圖例顯示/隱藏數據集的圖表功能非常好。是否有可能達到相同的效果,但點擊圖表畫布外的複選框?

    1熱度

    3回答

    我有一系列對應於地震數據的11個大矩陣。我想在循環中從各個矩陣中繪製數據。我將使用虛擬矩陣data1和data2來說明我的問題。 load('data1'); load('data2'); %data1 and data2 are large matrices matrixname={data1 data2}; for j=1:2 matrix=matrixname(j);

    1熱度

    2回答

    我代表電影IDS(第一列)和評級爲不同的用戶對於電影中的其餘列如下數據結構 - 這樣的事情: +-------+----+----+----+----+----+----+----+----+----+----+----+----+----+----+----+ |movieId| 1| 2| 3| 4| 5| 6| 7| 8| 9| 10| 11| 12| 13| 14| 15| +----

    2熱度

    2回答

    如何將一組任意列轉換爲Mllib矢量? 基本上,我有我的DataFrame的第一列有一個固定的名稱,然後是一些任意命名的列,每個列中都有Double值。 像這樣: name | a | b | c | val1 | 0.0 | 1.0 | 1.0 | val2 | 2.0 | 1.0 | 5.0 | 可以是任何數量的列。我需要獲得以下數據集: final case class Values

    0熱度

    1回答

    爲了做一個關於字符識別的項目,我找到了一個我可以用作訓練集的數據庫。另一方面,即使給出了下面的說明,我也無法理解給定的格式。如何找出這種格式,我找不到進一步的幫助。 字段1-6以逗號分隔。源製品的 ID號碼 2字節符號代碼(寫在十六進制,使用4個字節)的位圖 位圖的 字符寬度 位圖圖像的 字符高度,其中每個8位單位被寫爲0到255的小數 換行 下面附加了數據庫文件(Google驅動器)的鏈接。 h