kaggle

    0熱度

    1回答

    是否有任何可用於多標籤多標籤分類的評估指標? 例如,我參加kaggle的以下比賽,並且它需要ROC AUC作爲評估量度。:http://www.kaggle.com/c/mlsp-2013-birds 使用sklearn可以做到這一點嗎?

    1熱度

    1回答

    我參加this Kaggle competition,我不知道是否有人在河 基本上與textmatrix功能的熟悉從LSA package ,textmatrix函數接受一個目錄作爲參數,它將使用指定目錄內的所有文本文件創建一個文本矩陣。 不幸的是,文本文件函數在遇到包含零項的文本文件時會發出錯誤(例如,如果您使用停用詞進行篩選,則會發生此錯誤)。 有誰知道一個簡單的方法有textmatrix 忽

    14熱度

    1回答

    讓我首先說我對R,KNN或數據科學一般沒有經驗。我最近發現Kaggle,並一直在玩Digit Recognition比賽/教程。 在本教程中,他們提供了一些示例代碼,以幫助您開始使用一個基本的提交: # makes the KNN submission library(FNN) train <- read.csv("c:/Development/data/digits/train.csv"

    0熱度

    1回答

    我是R和機器學習算法的新手,並試圖使用kaggle scikit example來學習。 我有以下兩個數據幀: > str(d.train) 'data.frame': 1000 obs. of 40 variables: $ V1 : num 0.299 -1.174 1.192 1.573 -0.613 ... > str(d.trainLabels) 'data.frame': 1

    4熱度

    1回答

    我試圖使用rfecv縮小與分類器真正相關的功能數量。這是我寫 import sklearn import pandas as p import numpy as np import scipy as sp import pylab as pl from sklearn import linear_model, cross_validation, metrics from sklearn

    0熱度

    1回答

    在OSX上將PyDev與Python 2.7的eclipse環境結合使用。嘗試對數組中的元素進行計數,然後總結數組中的元素。獲取索引錯誤。 import numpy as np import os import sys csv_file_object = fileName = os.path.join('train.csv') print('Directory separator on

    22熱度

    2回答

    我正在試圖學習如何在R中使用神經網絡。作爲一個學習問題,我已經一直在使用following problem結束於Kaggle: 不用擔心,這個問題是專門爲人們學習的,沒有與之相關的獎勵。 我從一個簡單的邏輯迴歸開始,這非常適合讓我的腳溼潤。現在我想學習使用神經網絡。我的訓練數據看起來像這樣(列:行): - survived: 1 - pclass: 3 - sex: male - age:

    0熱度

    1回答

    我試圖實現這在下面的博客文章中詳細討論了數字識別亨利馬烏程序(JAR):我收到以下錯誤http://www.markhneedham.com/blog/2012/10/27/kaggle-digit-recognizer-mahout-random-forest-attempt/ 當我執行Java程序: Exception in thread "main" java.lang.NoClassDef

    5熱度

    2回答

    我編寫了下列R代碼來標識目錄中的重複文件。如何使用plyr包(或類似的)向量化for循環?我想要獲得比我提出的更爲習慣的R解決方案。 library("digest") # to compute the MD5 digest test_dir = "/Users/user/Dropbox/kaggle/r_projects/test_photo" filelist <- dir(test_di

    0熱度

    3回答

    很多機器學習競賽在Kaggle舉行,其中一個訓練集和功能集和測試集,給出其輸出標籤須根據決定通過利用訓練集。 這是很清楚,在這裏監督學習算法,如決策樹,SVM等都是適用的。我的問題是,我應該如何着手解決這些問題,我的意思是從決策樹或SVM或其他算法開始,還是有其他方法,即如何決定?