我正在尋找一個能夠查找字節序列的非隨機屬性的Java程序或庫。如果數據顯示任何規律性,給予一個巨大的文件時會進行一些統計測試和報告。在Java中是否有任何測試非隨機性序列的軟件?
我知道三個這樣的程序,但不是在Java中。我嘗試了所有這些,但它們似乎並不適合我(這很令人驚訝,因爲其中一個是由NIST提供的)。其中最老的,diehard,工作正常,但使用起來有點困難。
我正在尋找一個能夠查找字節序列的非隨機屬性的Java程序或庫。如果數據顯示任何規律性,給予一個巨大的文件時會進行一些統計測試和報告。在Java中是否有任何測試非隨機性序列的軟件?
我知道三個這樣的程序,但不是在Java中。我嘗試了所有這些,但它們似乎並不適合我(這很令人驚訝,因爲其中一個是由NIST提供的)。其中最老的,diehard,工作正常,但使用起來有點困難。
正如一些評論者所說,這確實是一個專家級的數學問題。我能爲您找到最簡單的解釋是:
這很有趣,但因爲它使用的頭或尾料「,以簡化其例子,你會發現你需要去多更深入地將相同的理論應用於加密/加密等 - 但這是一個好的開始。
另一種方法是使用Fuzzy logic。您可以從數據集中提取模糊關聯規則。這些規則是基本上形式含義:
如果A然後B,解釋例如「如果01101(存在),那麼1111(將遵循)」
谷歌搜索「模糊數據挖掘」 /「提取模糊聯想規則「應該會產生足夠多的結果。
實際上,您的問題域相當大,因爲這是數據/文本挖掘的全部內容。這和統計分析結合起來,僅舉幾例。
關於這樣做的程序 - 請看this。
不是你的問題的答案,而是你的評論"any observable pattern is bad"
。這讓我想到隨機性不是問題,而是可觀察的模式,爲了解決這個問題,你肯定需要觀察者。所以,簡而言之,就是建立一個網站並將其衆包。
這種技術的一些例子應用到顏色命名:http://blog.xkcd.com/2010/05/03/color-survey-results/和http://www.hpl.hp.com/personal/Nathan_Moroney/color-name-hpl.html
考什麼,你專門找跑? – jzd 2011-01-31 02:49:20
爲什麼你需要知道這個?你想看看文件是否可以進一步壓縮?這是一個很好的問題,我只是好奇。 :D – 2011-01-31 02:54:15