data-science

    2熱度

    2回答

    我有一個字符串列表(名詞短語),我想過濾掉所有有效的地理位置。其中大多數(不需要的位置名稱)都是國家或城市或州名。有什麼辦法可以做到這一點?是否有可用的開源查詢表,其中包含世界上所有的國家,州和城市? 實施例所需的輸出: TREC4:假,維也納:真,部:假,IBM:假,蒙特利爾:真,新加坡:真 不像這篇文章:Verify user input location string is a valid

    0熱度

    2回答

    我正在使用R軟件包「sparkTable」爲PDF報告創建一些降價表格。我有我想要的表格和圖表,但我似乎沒有看到格式化表格內的任何條款。在諸如kable和pander之類的東西中,您可以設置文本的位置,但似乎沒有辦法使用sparkTable。也許有一些LaTeX的做法。如果有人有任何想法,我會很感激。謝謝!

    1熱度

    1回答

    我想編寫一個腳本來從一些顯微鏡數據繪製熒光強度的散點圖和門檻基於細胞應對超過一定金額CFPMAX更大的這些數據,並以綠色和細胞繪製這些是不要紅色。當我嘗試繪製這個圖像時,我無法真正地將合適的顏色分配給點,並且它們最終變成藍色和紅色。我需要爲圖像中的每個像元分配4個值(每個熒光通道3個值和一個值以確定它是否響應(綠色或紅色)。因此,我想知道是否可以分配正確的顏色該矩陣的第4列,或者如果我要對這個錯誤

    2熱度

    2回答

    我使用的是Mac OSX Yosemite 10.10.5,我試圖在筆記本電腦上用python練習數據科學。我在virtualenv上使用python 3.5.1,但是當我安裝熊貓和matplotlib好像他們兩個在嘗試導入時都有衝突。既有相同的錯誤,並且輸出: >>> import matplotlib Traceback (most recent call last): File

    2熱度

    2回答

    我正在尋找關於如何組織Python機器學習項目的信息。對於Python常用項目,有Cookiecutter和R ProjectTemplate。 這是我目前的文件夾結構,但是我將Jupyter筆記本與實際的Python代碼混合在一起,看起來不太清楚。 . ├── cache ├── data ├── my_module ├── logs ├── notebooks ├── script

    -1熱度

    1回答

    我有一個功能「技能」,這是一個多值參數。我想用它作爲分類的一個功能。我不知道如何用它來訓練我的模型。 例如,某個工作具有某些必需的技能(比如說Java,Node.js,MVC),對於不同的工作可能會有所不同。我必須使用技能作爲參數之一。 任何幫助,將不勝感激。 謝謝。

    3熱度

    2回答

    工作是否有從Clojure的調用Python與SciPy的,numpy的,scikit學習做數據科學的手段沒有什麼好的辦法,等 我知道它運行在Clojure中的實現python而不是java,但是這不會爲我工作,因爲我也需要在我的項目中調用java庫。我也瞭解Jython,但我不知道有一個乾淨的方式可以在Clojure中使用它。 我想在我的項目中使用Clojure,因爲我更喜歡它作爲一種語言,但我

    4熱度

    1回答

    如何將數據輸入keras?什麼是結構?具體來說,如果我有2列以上,x_train和y_train是什麼? 這是我想輸入的數據:我想在這個例子中多層感知神經網絡代碼Keras有其文檔中定義Xtrain 。 (http://keras.io/examples/)以下是代碼: from keras.models import Sequential from keras.layers.core impo