data-science

0熱度

1回答

我們正在Google電子表格中開發POC。有一些配置，但簡而言之，它從BigQuery下載數據並將其重定向到Prediction。我們的Bigquery表格已超過41Mb，不允許/受電子表格支持。我們認爲從Bigquery下載5Mb的數據包。儘管Predicition API爲insert大量數據提供了方法，但update方法允許僅上載一行/實例。有什麼方法可以直接將Bigquery數據

1熱度

1回答

在R中下載PDF所需的幫助

在下面的代碼中，每次嘗試下載PDF時，handle部分似乎都會給我一個錯誤。 url <- "http://brocktonpolice.com/wp-content/uploads/" filename <- paste0(format(AllDays, '%Y/%m/%m%d%Y'), '.pdf') filenames_list <- str_extract_all(filenames,

1熱度

1回答

在火炬的1000維輸出張量中爲特定索引獲取ImageNet標籤

我使用貓圖像獲得a Facebook implementation of the ResNet model的正向傳遞的輸出張量。這是一個具有分類概率的1000維張量。使用torch.topk我可以獲得輸出張量中的前5個概率及其指數。現在我想看看那些最可能的索引的人類可讀標籤。我在網上搜索了標籤的列表（這顯然也稱爲sysnets），只有發現這一點： http://image-net.org/cha

-2熱度

1回答

初始化在holts，冬天的季節性成分的

I am using the Holts Winters seasonal method (triple exponential smoothening) 作出預測。我想知道我們如何初始化seaonal部件我們有方程現在說我的M值爲365（我的數據是一年365天的每日數據）。爲了確定t = 1時的季節性分量，我需要時間t = -365處的季節性分量的值。同樣，我需要t = -364，t =

-6熱度

2回答

「樸素」貝葉斯在機器學習中意味着什麼？

1熱度

1回答

火花線性迴歸特徵哈希

我想用Spark的LinearRegressionWithSGD來預測國家&設備的價格。在查看Spark MLLib的feature extraction section之後，我有點不清楚應該如何散列這些特性。一個例子紀錄是：（前murmur哈希） {"price": 3.37, "site_id" 12, "brand_id": 332, "brand_type": "axcssdsdac",

1熱度

2回答

Elixir for Data Science

我最近開始使用Elixir，一些模式讓我想起Python，它在數據科學項目中被廣泛使用。例如列表解析或匿名函數。考慮到Elixir的高性能以及運行多個進程和處理異步任務的能力，它接近我，非常適合Data Science項目。我錯過了一個觀點嗎？有人有這方面的經驗嗎？

1熱度

1回答

ScikitLearn從管道內的FeatureUnion中提取特徵名稱

我使用SKlearn的管道模型來提取並構建一個聯合特徵，然後將其發送到隨機森林分類器，而某些特徵提取器可以在以後刪除或添加，請考慮結構如下： model = Pipeline([ ('feature_extract', FeatureUnion([ ('feature A', extracorA()), ('f

2熱度

1回答

Pandas中的索引錯誤

我無法找到索引中的錯誤。我相信這肯定是一個愚蠢的錯誤。我想將這些行的'td'值設置爲'block'大小爲1的0。我首先找到這樣的行，然後使用這些索引將'td'列的值設置爲0. 這裏是樣本數據集。這裏，除了塊號5,7,8之外的所有其他塊值應在'td'列中設置爲0。 Sid Itemid Block td 0 1 214536502 1 180.591 1 1 2145365

0熱度

1回答

設立的R-Studio外觀

我要讓我的代碼易於閱讀。比如我想在紅HIST函數的顏色參數（劇情和休息紅色）和他們的藍色值（藍色FALSE和20） - HIST（劇情= FALSE，allzips $百分位數，休息= 20）。有誰知道在R-studio中設置哪些參數？我一直在玩很多外表，但從來沒有得到解決。感謝， Kalbi