data-processing

    1熱度

    1回答

    我正在運行logistic迴歸,並且在使用Patsy的API準備數據時遇到問題,因爲它比一個小樣本大。 直接在數據框使用dmatrices功能,我離開了這個突然的錯誤(請注意,我打滑了一個EC2的RAM 300GB遇到這對我的筆記本電腦後,並得到了相同的錯誤): Traceback (most recent call last): File "My_File.py", line 22, in <

    0熱度

    1回答

    當應用R在SPSS Modeler中轉換Field操作節點時,系統會自動將以下代碼添加到我自己的頂部腳本與[R接口附加: while(ibmspsscfdata.HasMoreData()){ modelerDataModel <- ibmspsscfdatamodel.GetDataModel() modelerData <- ibmspsscfdata.GetData(ro

    0熱度

    2回答

    假設您有一個帶有少量後端php的html表單。該表格只有一個領域,它返回1或0。比如...... 而且PHP腳本提供有關用戶的操作系統的信息一起記錄這個在MySQL數據庫中。 因此,您可能會發現許多Windows8用戶喜歡華夫餅,但沒有太多Linux Mint用戶。 「哦... 87%的Windows 8用戶說是...這是我猜的。」 但是開發人員事先確實知道類別(即本例中的OS類型)並非。因此,實

    1熱度

    3回答

    請幫助,我有一個數據集,其中包含一列文字,其中包含用戶提及和他們的推文。我想提取EXCEL中推文中提到的所有用戶。換句話說,我想要完成這項任務:如果行的單元格值包含文本以@開始並以空格結束,則將該字符串值放入另一列中,對於列中的每一行,每個單元格可能包含更多而不是一個字符串的發生(在推文中提到的用戶不止一個)。問題是EXCEL公式可能與編碼無關嗎?如果是的話,你能否指導我使用哪個公式?如果不是,你

    0熱度

    2回答

    所以基本上我處理的培訓和測試數據集(一堆陣列)不等長這樣的: a: {true, [1,3, 4, 5, 5, 8 ,10 ,10]} b: {true, [1,3, 25, 18 ,1 ,10]} c: {false, [1, 8 ,10]} d: {false, [1,3 ,10 ,10]} 我是新來的機器學習方面,我在如何使這些未stucked -EQUal長度的輸入數組相等長度,

    8熱度

    3回答

    我有大量(〜1000)來自我正在嘗試處理的數據記錄器的文件。 如果我想使用 plot(timevalues,datavalues) 我希望能夠查看所有這些線路在同一時間以同樣的方式繪製從這些日誌文件,我可以做一個單一的一個趨勢以及示波器如何具有「持續」模式。 我也許可以湊齊的東西,使用直方圖,但我希望有預先存在的或更優雅的解決這個問題。

    0熱度

    1回答

    Spark,apache flink等數據處理引擎如何將結構化,半結構化和非結構化數據集成在一起並影響計算?

    0熱度

    3回答

    所以我希望這個問題已經得不到解答,但我似乎無法弄清楚正確的搜索術語。 首先一些背景: 我有表格式的文本數據文件,可以很容易地爬到10 GB的GB。處理它們的計算機已經從長時間的數據收集(高達30-50MB/s)中大量加載,因爲它正在進行設備處理和控制。因此,磁盤空間和訪問非常重要。由於空間限制,我們還沒有從旋轉磁盤轉移到SSD。 但是,我們正在尋找一些不需要每個數據點的剛剛收集的數據。我們希望能夠

    2熱度

    1回答

    我需要使用node.js分發數據處理策略。如果使用工作池並將這些工作人員中的任務組隔離是最好的方法,或者使用基於管道/節點的系統(如http://strawjs.com/),我試圖計算出 是最好的方法。 我已經有以下幾種(單個作業)的步驟: 提取含GIS形狀文件 將文件轉換爲GeoJSON的使用ogr2​​ogr 進行非標準化的數據一個zip文件以GeoJSON文件 將數據轉換到我在MongoDB

    0熱度

    1回答

    我需要編寫一個API來訪問從Web服務器以HTML文檔形式提供的數據。我需要我的用戶能夠對數據執行查詢。 說在一個網站上有一個頁面列出項目及其所有者。然後,爲每個所有者提供有關其聲譽的信息的所有者的另一組簡檔頁面。我可能需要回答的一個示例查詢是「給我ID和2013年提交的所有項目的所有者,其所有者的聲譽至少爲10」。 給出一個查詢來回答,我需要能夠屏幕只刮我需要回答手頭查詢的網站部分。理想情況下,