kaggle

    0熱度

    2回答

    我正在處理來自Kaggle的數據集,並且想要提取帶有名稱的Pandas列的標題。我使用下面的代碼: def extract_patt(patt, linea): matchObj = re.match(patt, linea) result = "" if matchObj: return matchObj.group(1).lower()

    1熱度

    1回答

    我一直試圖讓張量流在多類kaggle問題上工作。基本上,數據由我已轉換爲所有數字觀測值的6個特徵組成。目標是使用這6個功能來預測出行類型,其中有38種不同的出行類型。我一直試圖用tensorflow來預測這些旅行類型的類。以下代碼是我目前爲止的內容,包括我用來格式化csv文件的內容。代碼將運行,但運行1的輸出開始運行,然後在剩餘運行中輸出相同時輸出很差。以下是在運行狀態下輸出的例子: Run 0,

    1熱度

    1回答

    我正在從Kaggle爲泰坦尼克號案件執行學習任務。 如果我手動分離數據或使用cross_val_score執行線性迴歸,我有不同的預測精度。邏輯迴歸也是如此。 示例。 - 線性迴歸。 手冊 Algorithm = LinearRegression() kf = KFold(dataset.shape[0], n_folds=3, random_state=1) predictions = []

    3熱度

    2回答

    我正在使用Kaggle'train'數據集。 它包含891行。我正在使用的列是〜Survived。該列由因子值'0'和'1'組成。 train %>% ggvis(~Survived, fill = ~Survived) %>% layer_bars() 結果看起來是這樣的: 我想給的值「0條 我曾嘗試使用下面的代碼行繪製兩個值'紅色,值爲'1'的欄爲綠色。 有人可以幫我嗎? 預先感

    5熱度

    1回答

    我在嘗試kaggle挑戰here,不幸的是我被困在一個非常基本的步驟。我有限的Python知識必須被指責。 我試圖通過執行以下命令來讀取datasets成大熊貓數據幀: test = pd.DataFrame.from_csv("C:/Name/DataMining/hillary/data/output/emails.csv") 的問題是,這個文件,你會發現有超過30萬的記錄,但我只是讀79

    2熱度

    2回答

    我正在尋找關於如何組織Python機器學習項目的信息。對於Python常用項目,有Cookiecutter和R ProjectTemplate。 這是我目前的文件夾結構,但是我將Jupyter筆記本與實際的Python代碼混合在一起,看起來不太清楚。 . ├── cache ├── data ├── my_module ├── logs ├── notebooks ├── script

    3熱度

    1回答

    我正在翻譯以下Kaggle代碼到Python3.4: 在最後的線輸出的CSV文件時, predictions_file = open("myfirstforest.csv", "wb") open_file_object = csv.writer(predictions_file) open_file_object.writerow(["PassengerId","Survived"]) o

    3熱度

    1回答

    我對所有這些方法都很陌生,試圖得到一個簡單的答案,或者如果有人能指示我在網上的某個高級解釋。我的谷歌搜索只返回kaggle示例代碼。 extratree和randomforrest是否基本相同? xgboost在選擇任何特定樹的特徵時使用提升,即對特徵進行採樣。但是其他兩種算法如何選擇這些特徵呢? 謝謝!

    1熱度

    2回答

    嗨,我正在使用Kaggle泰坦尼克號數據。我使用apply(lambda x: x.upper())來處理多個列,但它不起作用。 我把數據放在我的谷歌驅動器上,你可以下載here。 我測試每一列,這是所有object類型(我認爲這意味着str,糾正我,如果它是錯誤的請)。但一些列報告'float' object has no attribute 'upper' import numpy as np

    0熱度

    1回答

    我想在我的機器上運行Kaggle中某人的腳本演示。相關線上: traindf = pd.read_json("C:/Users/myUserName/Documents/input/train.json") 給出的錯誤是: File "C:\SciSoft\WinPython-64bit-2.7.9.4\python-2.7.9.amd64\lib\site-packages\pandas\i