normalization

    3熱度

    1回答

    對於沒有理論最大值的特徵進行規範化/標準化最好的方法是什麼? 例如,股票價值一直在0-1000美元之間的趨勢並不意味着它不能繼續上漲,那麼正確的方法是什麼? 我曾考慮過培養一個更高的模型(例如2000),但它感覺不對,因爲沒有數據可用於1000-2000範圍,我認爲這會引入偏差

    0熱度

    1回答

    我目前正在使用數據庫正常化,並且我發現很多來源在獲取1NF的方法上有所不同。 例如,這是我的UNF表: customer +----+--------+----------------------+ | id | name | phone | +----+--------+----------------------+ | 1 | achmed | 06-101010, 06-111

    1熱度

    1回答

    我試圖讀取並正常化numpy中的3通道圖像。對於圖像中的每個通道,我想計算大於零的像素值的平均值。 我開始: from scipy import misc img = misc.imread('test.png') print(type(img)) #<type 'numpy.ndarray'> print(img.shape) #(512, 512, 3) 但我不知道第1)如何索引超出

    0熱度

    1回答

    我每天都會收到一個平面文件(CSV),其內容會被導入到我的數據庫中(而不是通過Web表單,POS等的數據輸入)。有一個記錄中有40個字段,我有600,000個獨特的記錄。 到目前爲止,我還沒有看到有必要將這個關係數據庫作爲關係數據庫,儘管肯定會有一些規範化使它更有效;重複的產品,商店,客戶,經銷商等 如果我從一開始就開始並以某種方式逐步輸入數據,我會知道如何做到這一切(我經歷的每一個資源都涵蓋了但

    1熱度

    1回答

    我有一個包含youtube視頻視圖的數據框,我想在1-10範圍內縮放這些值。 下面是值的樣子的樣本?我如何在1-10範圍內對其進行標準化,或者有沒有更有效的方法來做這件事? rating 4394029 274358 473691 282858 703750 255967 3298456 136643 796896 2932 220661 48688 4661584 2

    0熱度

    1回答

    我想通過用戶定義的規範化規範化數據框的選定列。到目前爲止,我將與 library(tidyr) library(ggplot2) Mode <- function(x, na.rm = TRUE) { x <- lapply(x, as.numeric) distribution <- hist(x, breaks = 50, plot = FALSE) dis

    0熱度

    1回答

    比方說,我有一個熊貓的數據幀,我想正常化只有某些屬性,但不能使用此功能的幫助下,整個數據幀: preprocessing.normalize ,我想就地這些標準化列到我的數據框。但我不能因爲它有不同的格式(numpy數組)。 我已經看到了怎麼辦正常化其他方式,例如我不喜歡這樣的: s0 = X.iloc[:,13:15] X.iloc[:,13:15] = (s0 - s0.mean())/

    4熱度

    1回答

    我有下面的代碼示例: var inputString = "ñaáme"; inputString = inputString.Replace('ñ', '\u00F1'); var normalizedString = inputString.Normalize(NormalizationForm.FormD); var result = Regex.Replace(normalizedS

    -7熱度

    1回答

    我在MATLAB新的,我有一個文件包含657列和97行,我想這些標準化數據0和1

    0熱度

    4回答

    我有點卡住設計數據庫的一部分。 我有一張名爲Staff的表格。它具有不同的屬性: StaffID First Name Last Name Job Title Department Number Telephone Number StaffID是此表中的主鍵。 但是,我的問題是可以根據電話號碼找到任何信息(即每個工作人員都有不同的唯一電話號碼)。 例如,這意味着當我們有Phone N