k-means

    0熱度

    1回答

    我正在Python中構建k-means聚類模型。但是,我不確定如何保存羣集質心以及如何將它們用於未來的評分目的。 當我稍後使用模型時,我總是希望分配相同的羣集ID。 我會很感激,如果有人有一個明確的代碼來演示如何做到這一點。 更新: @HannounYassir嗨,肯定,對不起,我應該以前也做過這樣的: 想象一下,我的數據集的名字是data_clean和所有的變量都是標準化和前手清洗。 # def

    1熱度

    1回答

    在Ubuntu 16.04上運行最新(1.1.0)張量流(通過pip3 install tensorflow-gpu安裝),CUDA8 + CUDNN5。 代碼看起來或多或少是這樣的: import tensorflow as tf from tensorflow.contrib.learn import KMeansClustering trainencflt = #pandas fram

    -1熱度

    2回答

    我必須將我的人口聚類在8 clusters。我正在使用proc fastclus和k-means方法(以最小化羣集之間的差異)。觀察結果代表一個分數,所以即使在聚類過程之後,它們仍然是有序的。我注意到這樣: proc sort data=input.population; by score; run; proc fastclus data = input.population

    -1熱度

    1回答

    我正在練習使用python的K-means。 我正在處理一組購物數據,並且輸入數據集看起來像這樣。 輸入表頭: [用戶ID] [money_spent_on_clothes]詮釋 [money_spent_on_food] INT [money_spent_on_shoes] INT [money_spent_on_Monday] INT [money_spent_on_Tuesday ] int

    -5熱度

    1回答

    我有一個線性方程來聚集一些查詢,我想調整超參數。現在我想知道我可以使用「網格搜索」進行「k-means」聚類嗎?或者它不能用於k-means? 在我的工作中,我將數據分成80-20比例,80%的數據用於訓練模型,20%用於測試。 TNX

    0熱度

    2回答

    如何使用k-means聚類算法在這裏處理geolocated數據,有人可以在這裏分享您的輸入,在此先感謝。 Project_2_Dataset.txt file entries look like this ================================================= 33.68947543 -117.5433083 37.88

    0熱度

    1回答

    我目前新機器學習,我將努力對涉及使用機器學習庫檢測以及可能的異常警報的項目。我將使用Apache Spark,並決定使用KMeans方法來解決該項目。 主要項目包括在分析日常文件和檢測中的一些記錄,波動變化,並報告他們作爲可能的異常(如果它們被認爲是一個基於模型)。這些文件是在一天結束時生成的,我的程序需要在第二天早上檢查它們,看看是否有異常。但是,我需要檢查異常文件vs文件,而不是在文件中。這意

    1熱度

    1回答

    我想了解scipy.cluster.vq.kmeans。 在2D空間中分佈有許多點,問題是將它們分組爲簇。這個問題引起了我的關注,讀取this question,我在想,scipy.cluster.vq.kmeans將要走。 這是數據: 使用下面的代碼,所述目的將是獲得每個25簇的中心點。 import numpy as np import matplotlib.pyplot as plt f

    -2熱度

    1回答

    我正在研究一個涉及使用K均值模型進行異常檢測的項目。 但是,要獲得精確的幾乎和精確的結果,我需要找到K. 我的算法依賴於在我的模型的異常值一般由自己放置在羣集上的想法的最佳值。通常,「正常」數據將與其他正常數據聚集在一起,但異常數據會形成它們自己的聚類,因此表明存在異常。但是,我需要找到K的最佳值,以便我的算法能夠正常工作,並查看它是否合適。 關於如何找到一個好的K值的任何想法? 這是「正常的」虛

    0熱度

    1回答

    每當我打電話:出現 library(clValid) clValid(da_mat, nClust = 2:6,clMethods = "kmeans",method = "ward", validation = "internal",verbose = F,metric = "euclidean") 以下問題: 要集羣的項目數大於'maxitems' 所需的存儲空間和時間可能過多,您是否希