normalization

3熱度

1回答

對於沒有理論最大值的特徵進行規範化/標準化最好的方法是什麼？例如，股票價值一直在0-1000美元之間的趨勢並不意味着它不能繼續上漲，那麼正確的方法是什麼？我曾考慮過培養一個更高的模型（例如2000），但它感覺不對，因爲沒有數據可用於1000-2000範圍，我認爲這會引入偏差

0熱度

1回答

正常化從UNF到1NF

我目前正在使用數據庫正常化，並且我發現很多來源在獲取1NF的方法上有所不同。例如，這是我的UNF表： customer +----+--------+----------------------+ | id | name | phone | +----+--------+----------------------+ | 1 | achmed | 06-101010, 06-111

1熱度

1回答

Numpy ndarray圖像像素對於大於零的像素值的平均值：正常化圖像

我試圖讀取並正常化numpy中的3通道圖像。對於圖像中的每個通道，我想計算大於零的像素值的平均值。我開始： from scipy import misc img = misc.imread('test.png') print(type(img)) #<type 'numpy.ndarray'> print(img.shape) #(512, 512, 3) 但我不知道第1）如何索引超出

0熱度

1回答

平面文件作爲輸入 - MySQL最佳實踐

我每天都會收到一個平面文件（CSV），其內容會被導入到我的數據庫中（而不是通過Web表單，POS等的數據輸入）。有一個記錄中有40個字段，我有600,000個獨特的記錄。到目前爲止，我還沒有看到有必要將這個關係數據庫作爲關係數據庫，儘管肯定會有一些規範化使它更有效;重複的產品，商店，客戶，經銷商等如果我從一開始就開始並以某種方式逐步輸入數據，我會知道如何做到這一切（我經歷的每一個資源都涵蓋了但

1熱度

1回答

Python數據框的特定列之間的比例值1-10

我有一個包含youtube視頻視圖的數據框，我想在1-10範圍內縮放這些值。下面是值的樣子的樣本？我如何在1-10範圍內對其進行標準化，或者有沒有更有效的方法來做這件事？ rating 4394029 274358 473691 282858 703750 255967 3298456 136643 796896 2932 220661 48688 4661584 2

0熱度

1回答

如何將數據幀切片傳遞給R中的模式歸一化的直方圖函數？

我想通過用戶定義的規範化規範化數據框的選定列。到目前爲止，我將與 library(tidyr) library(ggplot2) Mode <- function(x, na.rm = TRUE) { x <- lapply(x, as.numeric) distribution <- hist(x, breaks = 50, plot = FALSE) dis

0熱度

1回答

規範化sklearn

比方說，我有一個熊貓的數據幀，我想正常化只有某些屬性，但不能使用此功能的幫助下，整個數據幀： preprocessing.normalize ，我想就地這些標準化列到我的數據框。但我不能因爲它有不同的格式（numpy數組）。我已經看到了怎麼辦正常化其他方式，例如我不喜歡這樣的： s0 = X.iloc[:,13:15] X.iloc[:,13:15] = (s0 - s0.mean())/

4熱度

1回答

刪除口音

我有下面的代碼示例： var inputString = "ñaáme"; inputString = inputString.Replace('ñ', '\u00F1'); var normalizedString = inputString.Normalize(NormalizationForm.FormD); var result = Regex.Replace(normalizedS

-7熱度

1回答

如何在Matlab中規範大數據？

我在MATLAB新的，我有一個文件包含657列和97行，我想這些標準化數據0和1

0熱度

4回答

不知道這是否構成傳遞依賴

我有點卡住設計數據庫的一部分。我有一張名爲Staff的表格。它具有不同的屬性： StaffID First Name Last Name Job Title Department Number Telephone Number StaffID是此表中的主鍵。但是，我的問題是可以根據電話號碼找到任何信息（即每個工作人員都有不同的唯一電話號碼）。例如，這意味着當我們有Phone N