2010-12-12 71 views
1

我想計算標籤分隔的文本文件中的13個變量之間的皮爾遜相關性,其中每列是變量。我正在使用java,並希望有人可以給我一些關於哪些庫或我應該使用哪些函數的指導。我猜測我首先需要閱讀文件的內容,但不知道如何讓程序知道每個列都像是一個數組,這使我能夠完成我所需的計算。我原以爲java.io包是我開始使用的最佳位置,但卻無法弄清楚我可以使用哪些類來解決問題。我也看過http://commons.apache.org/math/,它具有測量皮爾遜相關性的功能,但這太容易了,因爲這是一個Uni任務,我必須從零開始實施它。通過查看appache皮爾遜相關性,他們似乎已經接近像矩陣那樣的矩陣,矩陣的每一列都是一個變量。需要一些指向正確的方向關於計算皮爾遜的相關性在java

對不起,我的問題的漫長描述。如果你們知道任何網站或任何好的kewords搜索或任何其他信息,我將不勝感激。謝謝,Arlind。

回答

1

你應該可以使用標準的java數學,字符串,文件I/O庫,以及一些數組和循環來做到這一點!

請先閱讀本文,以瞭解如何閱讀文件。 http://www.roseindia.net/java/beginners/java-read-file-line-by-line.shtml

循環內部使用String.split(String regex)方法解析您的csv文件。例如strLine.split( 「」)。

轉換這對雙打的陣列,通過使用Double.parseDouble在串中的每個串[]

從那裏可以使用 Math.sqrt(雙a)和 Math.pow(雙a,double b)函數以及一些簡單的循環來計算每對變量的相關性。

希望這是足夠的信息讓你開始,如果你想獲得更多幫助,請隨時發回。

+0

嗨塞繆爾。這麼晚纔回復很抱歉。我有一段時間沒有去過。非常感謝您的建議。現在我可以逐行讀取一個文件,並將其分成不同的行。我似乎無法做到的是將這些行轉換爲單獨的雙打數組。我看過不同的書籍和網頁,但找不到任何有用的東西。你可能知道任何在線資源,可以幫助我更好地理解。在此先感謝,Arlind。 – Jetnor 2011-01-13 02:17:18