2014-10-05 61 views
0

我在bash腳本中使用的領結指數產生的蝴蝶結索引文件如下:頂禮帽找不到領結索引文件,即使路徑是正確的

bowtie-build $FA_FILE $OUTPUT_BASE 

(腳本可以在這裏找到:https://github.com/kennethphough/bioinformatics/blob/master/sge/sge_build_index

我希望我的羣集中的每個節點都將我的序列文件與染色體對齊,而不是整個基因組。所以理論上,如果我爲每個節點上的同一個序列文件爲每個染色體運行一個tophat實例,它應該比在整個基因組的一個節點上運行tophat更快。

我確信,我的領結索引文件的位置被導出,像這樣:

export BOWTIE_INDEXES="$(dirname ${EBWT})/" 

,然後再執行高頂禮帽,像這樣:

tophat -p 4 -G $GTF -o $OBASE $Chr $FASTQ 

$GTF包含註釋文件路徑, $Chr包含索引文件的文件名(不包括文件擴展名.ebwt),$FASTQ包含我的序列讀取文件的路徑。

(腳本可以在這裏找到:https://github.com/kennethphough/bioinformatics/blob/master/sge/sge_tophat

當我運行該腳本,我得到一個錯誤說領結指數不能foudn。下面摘錄:

[Sun Oct 5 15:08:48 2014] Beginning TopHat run (v1.1.2) 
----------------------------------------------- 
[Sun Oct 5 15:08:48 2014] Preparing output location /home/kennethphough/GSE58365/fast/chr11_gl000202_random.1/ 
[Sun Oct 5 15:08:48 2014] Checking for Bowtie index files 
Error: Could not find Bowtie index files /home/kennethphough/genome/hg19/chr11_gl000202_random.1.* 

有問題的領結索引文件上面的錯誤是chr11_gl000202_random.1.ebwt我已經證實了它的存在。任何出現問題的線索都將不勝感激。

蝴蝶結的版本是0.12.7 頂禮帽版本1.1.2

+0

您的問題中的鏈接已死亡,因此對其他用戶無用。 – Stefan 2014-10-09 05:59:33

+0

對不起固定鏈接 – pandoraEudora 2014-10-10 02:17:28

+0

我很高興你想出了你的問題,但你應該考慮獲得這些軟件的最新版本......(即領結是1.1.1和頂帽是2.0.13) – bdeonovic 2014-10-10 02:21:36

回答

0

的問題是,有不止一個文件領結指數。因此,對於上述chr11_gl000202_random的例子有:

chr11_gl000202_random.1.ebwt 
chr11_gl000202_random.2.ebwt 
chr11_gl000202_random.3.ebwt 
chr11_gl000202_random.rev.1.ebwt 
chr11_gl000202_random.rev.1.ebwt 

所以不是文件名沒有經過我需要得到染色體序列的名字,像這樣的擴展:

Chr=`echo "$FNAME" | awk -F. '{print $1}'` 

我已經更新我的腳本在github上反映這些變化。

相關問題