我有一個數據集,在這個數據集中我需要查看來自另一個組內的所有項目對。我已經在下面創建了一個玩具示例來進一步解釋。SAS中的SQL SQL - 所有對項目
BUNCH FRUITS
1 apples
1 bananas
1 mangos
2 apples
3 bananas
3 apples
4 bananas
4 apples
我想要的是所有可能的對的列表,並總結它們在一堆中出現的頻率。我的輸出在理想情況下是這樣的:
FRUIT1 FRUIT2 FREQUENCY
APPLES BANANAS 3
APPLES MANGOS 1
我的最終目標是使東西,我最終能夠導入Gephi的網絡分析。爲此,我需要一個源和目標列(又名FRUIT1和FRUIT2)。
我認爲還有其他一些方法來處理這個問題,而不使用PROC SQL(也許使用PROC TRANSPOSE),但這是我開始的地方。
SOLUTION
感謝您的幫助。下面的示例代碼有興趣的人類似的東西:
proc sql;
create table fruit_combo as
select a.FRUIT as FRUIT1, b.FRUIT as FRUIT2, count(*) as FREQUENCY
from FRUITS a, FRUITS b
where a.BUNCH=b.BUNCH and and not a.FRUIT= b.FRUIT
group by FRUIT1, FRUIT2;
quit;
謝謝!這正是我需要做的。 – pmbaumgartner