data-science

    0熱度

    1回答

    我們正在Google電子表格中開發POC。 有一些配置,但簡而言之,它從BigQuery下載數據並將其重定向到Prediction。 我們的Bigquery表格已超過41Mb,不允許/受電子表格支持。 我們認爲從Bigquery下載5Mb的數據包。 儘管Predicition API爲insert大量數據提供了方法,但update方法允許僅上載一行/實例。 有什麼方法可以直接將Bigquery數據

    1熱度

    1回答

    在下面的代碼中,每次嘗試下載PDF時,handle部分似乎都會給我一個錯誤。 url <- "http://brocktonpolice.com/wp-content/uploads/" filename <- paste0(format(AllDays, '%Y/%m/%m%d%Y'), '.pdf') filenames_list <- str_extract_all(filenames,

    1熱度

    1回答

    我使用貓圖像獲得a Facebook implementation of the ResNet model的正向傳遞的輸出張量。這是一個具有分類概率的1000維張量。使用torch.topk我可以獲得輸出張量中的前5個概率及其指數。現在我想看看那些最可能的索引的人類可讀標籤。 我在網上搜索了標籤的列表(這顯然也稱爲sysnets),只有發現這一點: http://image-net.org/cha

    -2熱度

    1回答

    I am using the Holts Winters seasonal method (triple exponential smoothening) 作出預測。我想知道我們如何初始化seaonal部件我們有方程 現在說我的M值爲365(我的數據是一年365天的每日數據)。爲了確定t = 1時的季節性分量,我需要時間t = -365處的季節性分量的值。同樣,我需要t = -364,t =

    -6熱度

    2回答

    「樸素」貝葉斯在機器學習中意味着什麼?

    1熱度

    1回答

    我想用Spark的LinearRegressionWithSGD來預測國家&設備的價格。在查看Spark MLLib的feature extraction section之後,我有點不清楚應該如何散列這些特性。一個例子紀錄是:(前murmur哈希) {"price": 3.37, "site_id" 12, "brand_id": 332, "brand_type": "axcssdsdac",

    1熱度

    2回答

    我最近開始使用Elixir,一些模式讓我想起Python,它在數據科學項目中被廣泛使用。例如列表解析或匿名函數。 考慮到Elixir的高性能以及運行多個進程和處理異步任務的能力,它接近我,非常適合Data Science項目。 我錯過了一個觀點嗎?有人有這方面的經驗嗎?

    1熱度

    1回答

    我使用SKlearn的管道模型來提取並構建一個聯合特徵,然後將其發送到隨機森林分類器,而某些特徵提取器可以在以後刪除或添加,請考慮結構如下: model = Pipeline([ ('feature_extract', FeatureUnion([ ('feature A', extracorA()), ('f

    2熱度

    1回答

    我無法找到索引中的錯誤。我相信這肯定是一個愚蠢的錯誤。我想將這些行的'td'值設置爲'block'大小爲1的0。我首先找到這樣的行,然後使用這些索引將'td'列的值設置爲0. 這裏是樣本數據集。這裏,除了塊號5,7,8之外的所有其他塊值應在'td'列中設置爲0。 Sid Itemid Block td 0 1 214536502 1 180.591 1 1 2145365

    0熱度

    1回答

    我要讓我的代碼易於閱讀。比如我想在紅HIST函數的顏色參數(劇情和休息紅色)和他們的藍色值(藍色FALSE和20) - HIST(劇情= FALSE,allzips $百分位數,休息= 20)。 有誰知道在R-studio中設置哪些參數?我一直在玩很多外表,但從來沒有得到解決。 感謝, Kalbi