large-data-volumes

    0熱度

    1回答

    我有一個擁有6000萬條記錄的數據庫。目前的設置是有一張桌子,有三千萬以上的桌子和一個小桌子,每個桌子有五百萬(ish)。每個表的數據結構都是相同的。第一次創建我們的搜索的人(3-4年前我在這裏)使用了多個小桌子。我們爲每個連接使用match against。我的老闆和他的印象是,使用多個表讓MySQL可以同時搜索每個表。在我讀到的所有內容中,每個人都說一張大桌子會更好,但隨着3000萬張桌子變得

    0熱度

    1回答

    假設,在我的應用程序中,我要求用戶輸入一些字符串。用戶可以多次輸入字符串。無論何時用戶輸入字符串,我都會將其與日期一起記錄在數據庫中。即使由不同的用戶輸入,許多字符串也可以是相同的。在主頁中,我需要提供界面,以便任何用戶在任何時間段(例如最後45天,或者2012年1月10日至2012年1月30日)之間查詢前n個(比如50個)字符串。如果是SQL,我可以寫如下查詢: select string, c

    0熱度

    1回答

    我有一個很大的(超過60多萬條記錄)表。 此表有一個主鍵(id,AUTO_INCREMENT索引ID) 我從這個表中選擇記錄的報告。要瀏覽並瀏覽此報告(用PHP編寫),我正在使用分頁腳本。 此腳本使用SELECT COUNT()獲取此表中的記錄總數。 SELECT COUNT()非常緩慢。 問題: 我可以查詢統計表基數場,INFORMATION_SCHEMA DB在表格名= my_large_ta

    4熱度

    1回答

    我有一個約600萬點的3D數據集。有沒有辦法使用contour3D繪製它?每次嘗試,mayavi都會失去記憶。 否則,是否有一種方法可以將volume()ctf中的顏色數量增加到256種以上的顏色。我有浮點數據值,並且必須將它們分離以使用Volume()。因此,我失去了很多信息。有沒有辦法解決這個問題?

    0熱度

    1回答

    我有一個查詢,在最壞的情況下會創建超過150K的實體。可能有30萬個實體的上限。我已經嘗試了幾種方法將這組數據返回給用戶......我使用sql Developer運行查詢,運行時間約爲.348秒。所以這不是任何形式的瓶頸。 創建像這樣嵌套查詢... List<Object[]> ObjList = (List<Object[]>) emf.createNativeQuery(assembleNe

    2熱度

    1回答

    我有一個很大(大於200K)的字符串數組,用於搜索文檔中的模式。在將其應用到文檔之前,我將數組中的每個條目轉換爲正則表達式。當我這樣做時,通過陣列並順序執行搜索所花費的時間將大大增加。我相信這對我在執行搜索之前依次應用於每個正則表達式的Pattern.compile語句是有用的。預編譯正則表達式可能是一種解決方法,但我注意到當我這樣做時,內存使用量急劇增加。在預編譯之前,Java應用程序在大小約爲

    1熱度

    1回答

    我想從大量交易數據中找出信息數據模式。 通常,我的數據是具有定義良好的列的記錄集(例如發件人,收件人,金額,貨幣地址等 - 我有大約40-50個不同的列),數據量將是數百萬(可能是100萬)記錄和我的目標是從這樣產生信息交易模式 - 誰購買特定項目最多,交易量最高的交易接受者,費用模式,誰獲得更多來自同一個另一個發件人的交易等。 此前我打算加載關係數據庫(Oracle/MySQL)中的數據並編寫復

    0熱度

    2回答

    我目前計算值,以填補15個長槍記錄的數據庫。第7工廠去只是鰭片,電子但是現在我的更新查詢開始給人的問題: 現在&然後隨機字母變成一些jibberish。 在java中我生成查詢這樣做的: String updateSql = "UPDATE VanNaar SET time = CASE ID "; for (int i = 0; i < routes.size(); i++) {

    4熱度

    1回答

    我正在建立一個價格比較網站,可以容納大約300,000個產品和幾百個客戶。 在日常基礎上的站點需要價格和供應商的庫存情況的更新。 當供應商需要更新我在想刪除所有的供應商信息,然後拉起並插入一個新的 - 每一次。 這樣做,我不擔心供應商刪除產品。以一種簡單的方式,我每天都會得到一組新的數據。 在另一方面,我需要保持在檢查自動增量計數器,它似乎是一種浪費,以從供應商刪除一切,如果他在他的整個倉庫只有更

    4熱度

    4回答

    我試圖從包含約700萬條記錄的表中獲得4個隨機結果。此外,我還希望從同一個表中獲取4個按類別過濾的隨機記錄。 現在,您可能會想像在一張桌子上隨機排序,這會導致查詢花費幾秒鐘,這並不理想。 我認爲non-filtered結果集的另一種方法是讓PHP選擇一些在1-7,000,000左右的隨機數,然後用查詢做一個IN(...)只抓住這些行 - 是的,我知道這種方法有一個警告,因爲如果具有該ID的記錄不再