我有94個製表符分隔的文件,沒有標題,在單個目錄'/路徑/'與基因名稱在第一列和計數在第二列。有23000行。閱讀並cbind目錄中的多個文件的第二列
我想讀取/ path/in到R中找到的所有94個文件,併合並所有94個文件以創建單個數據框'counts.table',其中第一列包含基因名稱(相同和在所有94個文件的列1中的相同順序)和第二至第九十五列包含來自每個單獨文件(即,94個文件中的每一個的第2列,它們是唯一編號)的計數。最終counts.table數據框將有23000行和95列。
理想情況下是這樣的:
Column1 Column2 Column3 Column4... to column 95
gene a 0 4 3
gene b 4 9 9
gene c 3 0 8
...
to row 23000
列2包含樣本X計數,從欄3樣本Y,從樣本Z 4列等統計
我一定要讀取每個文件在與R單獨和然後通過添加每個文件的第二列與cbind來創建'counts.table'來合併它們全部?提前致謝。
所有文件中的基因名稱是否相同? – jlhoward