2016-09-30 59 views
-2

所以我的問題是關於我面臨的一個特殊問題,即我作爲當前工作的一部分必須參與的領域之一。來自交易級別數據的帳戶級別視圖

該域名是信用卡交易。所以它在交易層面是獨一無二的。但是一個人可能會進行多次交易。現在顯然每筆交易都不會完全相同。

所以我有這個基本的特徵數據集,我可以輕鬆管理。從這個數據集中,我想要評估各個細分市場的客戶級別性能,這些數據應該很容易訪問,而無需爲不同的變量組合運行我的代碼。基本上,我所瞄準的是以客戶層面的觀點來看,這不會導致信息在賬戶方面的任何損失,而且我仍然可以在各個細分市場的客戶層面上查看性能。

你們有沒有做過類似的分析?或者你有什麼好的想法,應該怎麼做?我不知道這個解釋有多清晰,但是讓我知道你是否需要進一步解釋。謝謝你的幫助!

+0

你需要更具體。你有什麼,你想要什麼,你有什麼嘗試...... – DCR

+0

好吧,所以我有交易ID。哪些是獨特的。反對每個交易ID將是賬戶ID。這將會重複。每個交易將由一組類別變量來定義。假設每筆交易都有變量A,B,C,D。我必須對這些變量的每個組合進行性能分析。帳戶ID在每個組合中都是唯一的。假設問題是我必須總結我在A,B級的表現;和A,B和C級別。 我想在一個csv中查看這兩個視圖。目前我所想到的僅僅是一個proc摘要並且切換_TYPE_變量。 –

+0

如果您想要幫助,可以讓人們輕鬆地幫助您。用你所擁有的東西發佈你的一小部分數據庫樣本,然後嘗試發佈你想要的模型 – DCR

回答

0

假設您有來自10位客戶的30筆交易的數據(每筆交易三筆交易)。在關係型數據庫中(通常在SAS中也是一個好主意),您通常會擁有一個事務表(具有列transactionID,customerID,transactionDate,transactionAmount)和一個客戶表(具有customerID,customerName,customerSegment等列) 。這是數據庫正常化的一部分。您將交易級數據與客戶級數據分開。

如果您是PROC SQL的粉絲,那麼在SAS中,該設置對您將會很有幫助。如果你想分析某個customerSegment的事務,你只需加入表(或子查詢或其他)。

SAS中的另一種選擇是通過customerID合併兩個表,創建一個數據集,每個事務有一個記錄,並且有一些變量是事務屬性,其他變量是客戶屬性。所以可能看起來像:

custID transID transDate transAmount customerSegment customerDOB 
1  1  1/1/2015 100   A    1/1/1990 
1  2  1/2/2015 50   A    1/1/1990 
1  3  1/3/2015 75   A    1/1/1990 
2  4  1/1/2015 10   B    12/12/1950 
2  5  1/2/2015 5   B    12/12/1950 
2  6  1/3/2015 75   B    12/12/1950 

也就是說高效的存儲少(少標準化),因爲重複來自同一個客戶的每一筆交易的客戶屬性的值。但是,當您想要通過客戶屬性分析交易數據時,它可以使生活更輕鬆。

欲瞭解更多關於此,谷歌數據庫規範化。 Toby Dunn在SAS中有一些關於標準化的很好的論文,例如, http://analytics.ncsu.edu/sesug/2007/TU03.pdf