multi-dimensional-scaling

    0熱度

    3回答

    我早先問過「如何將兩列顯示爲二進制(存在/不存在)矩陣?」。這個問題得到兩個很好的答案。現在我想更進一步,通過物種欄向原始地點添加第三欄,以反映每個地塊中每個物種的生物量。 第1列(小區)指定〜200個地塊的代碼,第2列(物種)指定約1200個物種的代碼,第3列(生物量)指定乾重。每個小區有> 1個物種,每個物種可以出現在> 1個小區。行的總數爲〜2700 > head(dissim)

    2熱度

    1回答

    我希望顯示的文本文檔的相似性我使用這scikit學習的TfidfVectorizer爲tfidf = TfidfVectorizer(decode_error='ignore', max_df=3).fit_transform(data) ,然後進行餘弦相似度計算作爲cosine_similarity = (tfidf*tfidf.T).toarray() 它給出了相似性,但sklearn.man

    0熱度

    1回答

    在我的領域中的很多文章中,這個句子已被重複:「這2個矩陣已被歸一化爲具有相同的平均和平方(跨所有主題和所有體素計算每種模態)」。假設我們有兩個矩陣,行定義不同的主題,列是特徵(體素)。在這些文章中,對標準化方法沒有太多的解釋。有誰知道我應該如何規範化數據有「相同平均和平方」?我根本不理解它。謝謝

    2熱度

    4回答

    我在sci-kit學習中構建了一個線性迴歸模型,並將輸入作爲sci-kit學習管道中的預處理步驟進行縮放。有什麼辦法可以避免縮放二進制列嗎?發生的是這些列與其他列進行縮放,導致值集中在0左右,而不是0或1,所以我得到的值如[-0.6,0.3],這導致輸入值爲0影響我的線性模型中的預測。 Basic代碼來說明: >>> import numpy as np >>> from sklearn.pip

    0熱度

    1回答

    我試圖將MDS應用於基於分歧的距離矩陣(即它是「HSAUR」包中的「投票」數據集)。我試圖將其縮小到2維並繪製沒有cmdscale()函數,但是當我嘗試自己做時,不能得到相同的結果。這是代碼; library(HSAUR) n <- 15 deltaD = voting deltaDstar = deltaD^2 I = matrix(0,n,n) diag(I) <- 1 J

    0熱度

    1回答

    如何通過R中的迭代優化實現多維縮放?有沒有人有想法如何編碼Guttman的變換?

    3熱度

    1回答

    我想用嵌套因子製作nMDS數據圖。我希望nMDS通過使用符號和顏色在一個圖上顯示這兩個因素。 在此重現的實例中,如果被use嵌套在moisture,我想的情節,以顯示作爲Moisture不同的符號,然後Use爲不同的顏色。 到目前爲止,我已經想通了這一點: library("vegan") library("BiodiversityR") data(dune, dune.env) MDS

    2熱度

    1回答

    我有一個使用sklearn.manifold.MDS函數在其上執行多維縮放(MDS)的差異矩陣。矩陣中某些元素之間的不相似性沒有意義,因此我想知道是否有方法在稀疏矩陣或缺失值的矩陣上運行MDS? 根據this的問題,與0的不同點被認爲是缺失值,但我在官方文檔中找不到這個語句。與值0解釋爲非常接近的點不是相似點嗎? 任何建議如何獲得我的高維數據集基於稀疏相異矩陣的低維表示將受到歡迎。謝謝!

    0熱度

    1回答

    我正在使用vegan包中的simper函數。簡而言之,simper比較了一組組,並計算了哪些變量對它們的不相似性貢獻最大,以及在給出累積貢獻的名爲cusum的列中計算了多少變量。輸出是每個組間對比度和結果的嵌套列表。例如。 library(vegan) library(data.table) library(tidyr) data(dune) data(dune.env) sim <-

    1熱度

    1回答

    假設我們有一個這樣的數據幀: dat <- data.frame( a = rnorm(1000), b = 1/(rnorm(1000))^2, c = 1/rnorm(1000), d = as.factor(sample(c(0, 1, 2), 1000, replace=TRUE)), e = as.factor(sample(c('X',