correlation

    18熱度

    2回答

    我有兩個1D陣列,我想看看他們的相互關係。我應該在numpy中使用什麼程序?我正在使用numpy.corrcoef(arrayA, arrayB)和numpy.correlate(arrayA, arrayB),兩者都給出了一些我無法理解或理解的結果。有人可以請說明如何理解和解釋這些數值結果(最好使用一個例子)?謝謝。

    -1熱度

    2回答

    中有兩個目錄DIR1和DIR2 365二進制文件,這些文件具有相同的格式,字節,延伸等... 下面給出將在DIR1和DIR2作爲矢量讀出,然後計算相關的代碼。 基本上我想要得到相關圖,我們只是計算每個網格像素的R值。假設我們要計算dir1和dir2之間的全局相關性映射,我們爲每個像素提供了來自dir1和dir2的兩列數據,並且可以計算該像素的R值,然後簡單地對全局像素執行循環。 dir1 <- l

    4熱度

    4回答

    對於文本分析程序,我想分析文本中某些單詞的共同出現。例如,我希望看到例如「巴拉克」和「奧巴馬」這兩個詞出現得更多一些(即,具有正相關性)。 這似乎並不困難。然而,說實話,我只知道如何計算兩個數字之間的相關性,而不是在文本中的兩個單詞之間。 我該如何最好地解決這個問題? 如何計算單詞之間的相關性? 我想過使用條件概率,例如,巴拉克奧巴馬比奧巴馬更有可能;不過,我嘗試解決的問題是更爲基本的,不依賴於的

    0熱度

    2回答

    我想比較兩個矩陣與鍵=文本,值=整數都具有相同的鍵,但不同的值。一個值是相關性,另一個值是密鑰出現頻率的計數器。 我如何關聯數據並找到最有意義的鍵? 我可以說100個字有關聯的因素和像這些計數: $relevance['google'] = 1000; $relevance['yahoo'] = 1300; $count['google'] = 4 $count['yahoo'] = 2

    0熱度

    1回答

    我知道有很多java的統計計算包,但在這種情況下,我需要一個目標C. 我的應用程序範圍我需要計算Cramer的V http://en.wikipedia.org/wiki/Cram%C3%A9r%27s_V的名義屬性一些基於屬性的類。我不想重新發明輪子。我還需要找到線性關聯和其他基本操作。 是否有任何已知的用於此目的的開源庫文件?

    3熱度

    1回答

    我非常想用純ggplot2方法重新創建此圖,因爲我想解決所有使用該包的繪圖。 用於產生此特定圖中的代碼如下。 library(PerformanceAnalytics) library(quantmod) getSymbols(c('SPY','LQD','GLD')) Data <- cbind(Cl(SPY),Cl(LQD),Cl(GLD)) Year <- as.factor(for

    18熱度

    6回答

    我有兩個時間序列,我懷疑他們之間存在時間偏移,我想估計這個時間偏移。 此問題已被問: Find phase difference between two (inharmonic) waves和find time shift between two similar waveforms但在我的情況下,時移小於數據的分辨率。例如數據以小時分辨率提供,時間偏移僅爲幾分鐘(見圖)。 原因在於用於測量其中一個

    2熱度

    1回答

    我有點小菜,所以我不知道這是否真的有可能。 我在我的MySQL數據庫兩場,我想相關: Level int(11) Rank enum('Hobo','Shippai','NoLifer',Troublemaker','gangster') (and so it continues.) 我想,這樣level 1=Hobo,level 2=Shippai等等,等等 目前,它看起來像這樣: Lev

    0熱度

    1回答

    我有3個表customer(客戶ID,姓名),customerbooking(bookingid,客戶ID),交易(交易,bookingid,typeoftransaction) 我想取 '客戶名稱' 的名義誰擁有最大typeoftransact ='current'。客戶表通過customerid鏈接到客戶預訂,客戶預訂鏈接到通過預訂ID進行的交易。使用加入我能夠獲得個人記錄,但無法獲得最大值

    1熱度

    1回答

    是否有很快計算spearman's rank correlation大量數據的方法。我們每個月都有幾千次這樣的計算,並且這些計算的總時間需要很長時間。是否有可能使用併發(線程)操作執行spearman的等級關聯,還是將計算分佈在多個核心(甚至是服務器)上?