kaggle

0熱度

2回答

我正在處理來自Kaggle的數據集，並且想要提取帶有名稱的Pandas列的標題。我使用下面的代碼： def extract_patt(patt, linea): matchObj = re.match(patt, linea) result = "" if matchObj: return matchObj.group(1).lower()

1熱度

1回答

Tensorflow多級ML模型問題

我一直試圖讓張量流在多類kaggle問題上工作。基本上，數據由我已轉換爲所有數字觀測值的6個特徵組成。目標是使用這6個功能來預測出行類型，其中有38種不同的出行類型。我一直試圖用tensorflow來預測這些旅行類型的類。以下代碼是我目前爲止的內容，包括我用來格式化csv文件的內容。代碼將運行，但運行1的輸出開始運行，然後在剩餘運行中輸出相同時輸出很差。以下是在運行狀態下輸出的例子： Run 0,

1熱度

1回答

Python + SciKit - >手動和cross_val_score預測的不同結果

我正在從Kaggle爲泰坦尼克號案件執行學習任務。如果我手動分離數據或使用cross_val_score執行線性迴歸，我有不同的預測精度。邏輯迴歸也是如此。示例。 - 線性迴歸。手冊 Algorithm = LinearRegression() kf = KFold(dataset.shape[0], n_folds=3, random_state=1) predictions = []

3熱度

2回答

Ggvis條形圖 - 選擇顏色

我正在使用Kaggle'train'數據集。它包含891行。我正在使用的列是〜Survived。該列由因子值'0'和'1'組成。 train %>% ggvis(~Survived, fill = ~Survived) %>% layer_bars() 結果看起來是這樣的：我想給的值「0條我曾嘗試使用下面的代碼行繪製兩個值'紅色，值爲'1'的欄爲綠色。有人可以幫我嗎？預先感

5熱度

1回答

在將csv導入熊貓數據框時沒有讀取所有行

我在嘗試kaggle挑戰here，不幸的是我被困在一個非常基本的步驟。我有限的Python知識必須被指責。我試圖通過執行以下命令來讀取datasets成大熊貓數據幀： test = pd.DataFrame.from_csv("C:/Name/DataMining/hillary/data/output/emails.csv") 的問題是，這個文件，你會發現有超過30萬的記錄，但我只是讀79

2熱度

2回答

Python機器學習/數據科學項目結構

我正在尋找關於如何組織Python機器學習項目的信息。對於Python常用項目，有Cookiecutter和R ProjectTemplate。這是我目前的文件夾結構，但是我將Jupyter筆記本與實際的Python代碼混合在一起，看起來不太清楚。 . ├── cache ├── data ├── my_module ├── logs ├── notebooks ├── script

3熱度

1回答

Python3 CSV writerows，類型錯誤： 'STR' 不支持緩衝器接口

我正在翻譯以下Kaggle代碼到Python3.4：在最後的線輸出的CSV文件時， predictions_file = open("myfirstforest.csv", "wb") open_file_object = csv.writer(predictions_file) open_file_object.writerow(["PassengerId","Survived"]) o

3熱度

1回答

xgboost，extratreeclassifier和randomforrestclasiffier有什麼區別？

我對所有這些方法都很陌生，試圖得到一個簡單的答案，或者如果有人能指示我在網上的某個高級解釋。我的谷歌搜索只返回kaggle示例代碼。 extratree和randomforrest是否基本相同？ xgboost在選擇任何特定樹的特徵時使用提升，即對特徵進行採樣。但是其他兩種算法如何選擇這些特徵呢？謝謝！

1熱度

2回答

python pandas upper（）不適用於字符串列

嗨，我正在使用Kaggle泰坦尼克號數據。我使用apply(lambda x: x.upper())來處理多個列，但它不起作用。我把數據放在我的谷歌驅動器上，你可以下載here。我測試每一列，這是所有object類型（我認爲這意味着str，糾正我，如果它是錯誤的請）。但一些列報告'float' object has no attribute 'upper' import numpy as np

0熱度

1回答

熊貓無法訪問我的文檔目錄中的json文件

我想在我的機器上運行Kaggle中某人的腳本演示。相關線上： traindf = pd.read_json("C:/Users/myUserName/Documents/input/train.json") 給出的錯誤是： File "C:\SciSoft\WinPython-64bit-2.7.9.4\python-2.7.9.amd64\lib\site-packages\pandas\i