data-science

    0熱度

    2回答

    嗨,我覺得這個問題可能是完全愚蠢的,但我仍然會問,因爲我一直在考慮這個問題。 有哪些優點,使用像matplotlib繪圖儀的,而不是現有的軟件或繪圖器。 現在,我猜想,雖然需要更多時間來使用這樣一個庫,你有更多的可能性嗎? 請讓我知道你的意見是什麼。我剛開始用Python學習數據科學,所以我想澄清一下。

    0熱度

    1回答

    我正在嘗試一個反對所有邏輯迴歸分類編輯文章的主題類別根據他們的文本使用vowpal wabbit。當我嘗試使用用於培訓的相同數據對新文章進行預測時,結果很差,但由於過度擬合,我期望得到不切實際的好結果。在這種情況下,我實際上想要過度擬合,因爲我想驗證我是否正確使用了vowpal wabbit。 我的模型被訓練上的例子看起來像這樣的,其中每個功能是從文章一個字,每一個標籤是一個類別的標識符,如體育或

    2熱度

    2回答

    對於網格搜索總是耗時,所以我想看看它現在運行多少。例如,它可能會輸出 paramsXXX processed paramsYYY processed ...

    -4熱度

    2回答

    我需要知道在Mac(el capitan)上安裝JQ的最有效方式。該代碼被下載到我的Mac,但我想知道我可以如何安裝和操作通過命令行。

    -1熱度

    1回答

    我很抱歉發佈這個簡單的問題,但我只是在預測分析世界中爬行。我的月收入爲Dec15-Apr16。我意識到樣本很小,但不幸的是,這是我需要處理的。 我嘗試在Excel中使用求解器,但它似乎不太準確。我試圖在R中使用時間序列和HoltWinters,但似乎我需要有24個週期,所以似乎我不能使用這種方法。請你幫我弄清楚如何預測5月份的價值(忽略季節性,限制等)? Revenue Dec-1

    0熱度

    1回答

    我在學習機器學習,並且遇到了這個code。 我想從上面的源文件運行文件"Recommender-Systems.py"。但它會拋出一個錯誤 ValueError: labels ['timestamp'] not contained in axis. 它如何被刪除? 這是u.data文件的下拉框link。

    0熱度

    1回答

    如何評估用於計算帖子熱度的算法?就像你會怎麼知道的那樣,指數衰減或redddit的算法表現更好?我知道這個問題可能有點天真,但我正在研究性能指標或成本函數來幫助解決這個問題?

    9熱度

    5回答

    簡單地說,如何在Python中對大熊貓數據框(可能是2,000,000行)應用分位數規範化? PS。我知道有一個包名爲rpy2可能在子跑R,使用R.位數正常化,但事實是,當我用數據設置如下R可以不計算正確的結果: 5.690386092696389541e-05,2.051450375415418849e-05,1.963190184049079707e-05,1.2583628699062518

    2熱度

    2回答

    使用R試圖合併原始矩陣以根據行值的值生成矩陣。 例: 來自: 1 2 a1 10 a1 20 a1 40 a2 45 a2 50 a3 40 a4 45 a4 60 到: 10 20 40 45 50 40 45 60

    2熱度

    1回答

    我正在使用多變量高斯分佈來分析異常。 這是訓練集的外觀 19-04-16 05:30:31 1 0 0 377816 305172 5567044 0 0 0 14 62 75 0 0 100 0 0 <Date> <time> <--------------------------- ------- Features ---------------------------> 可以說,上