2013-02-13 52 views
0

我對SAS編程非常陌生。但是,我有興趣使用這些數據來開發算法。但是,我並不總是連接到互聯網,所以通過網絡訪問數據庫不會是一種選擇。運行本地SAS數據庫

相反,我想知道:

  1. 什麼是複製一個非常大的SAS數據庫(3 TB)的最好方法?

  2. 是否可以使用我的PC(而不是專用硬件)來運行本地SAS服務器並執行SAS腳本?

+0

或者,如果2不可行,是否有可能/建議將SAS數據文件轉換爲不同的格式,如mysql? – Rishi 2013-02-13 07:41:58

回答

3

您當然可以在本地運行SAS,但桌面許可證很貴(取決於您許可的產品,第一年可能是2000美元)。你當然也可以將文件存儲爲MYSQL格式(或其他任何東西); MYSQL可以輕鬆讀取逗號分隔文件(CSV),並且可以很快從SAS生成創建表格腳本。

我會注意到,你通常不會將SAS文件引用爲'數據庫',儘管它沒有任何完全不準確的地方;然而,它們比整個數據庫(通常是用於許多表格的數據和元數據的一個自包含單元)更接近「表格」。 SAS文件通常稱爲「數據集」,SAS數據集和元數據(格式目錄等)的集合稱爲「庫」。

複製3TB SAS數據集(如果它是單個數據集)可以通過正常的文件傳輸方法(FTP,HTTP,Windows或UNIX副本等)完成。SAS數據集通常壓縮得非常好(即,3TB未壓縮的SAS數據集可能很容易壓縮到2-3GB,具體取決於具體細節)。您可能需要與數據集(存儲值標籤)一起獲取SAS格式目錄;此外,這是操作系統和位特定的(因此Windows 32位不能使用Unix甚至Windows 64位格式目錄);有一些方法可以獲取相應版本的格式目錄(或者更常見的是,獲取要在本地重新創建的目錄的數據集轉儲)。

2

是的,您可以爲PC授權SAS。

您是否打算將3tb數據集下載到您的本地環境?哇。如果您剛接觸SAS並希望開發算法,那麼爲什麼不從一些較小的數據集開始,例如那些隨SAS提供的或您自己創建的數據集?然後,一旦你已經確定了一個好的算法,那麼對於3tb數據集運行它的挑戰可能是有保證的。

或者可能首先獲得完整數據集的子集。