2014-08-29 53 views
0

我有一些來自Illumina NextSeq運行的.fastq文件。許多序列具有polyA片段,這使得它們映射變得複雜。我想刪除的連續十A的所有序列,並一直在努力這樣做,使用fastx_clipper如下:fastx_trimmer爲什麼認爲我的fastq文件是未知文件格式?

ha1c6n8$ fastx_clipper -l 32 -Q33 -n -v -a AAAAAAAAAA –i FR0826_S1_L004_R1_001.fastq –o FR0826_L004_trimmed.fastq 

這導致以下錯誤信息:

fastx_clipper: input file (-) has unknown file format (not FASTA or FASTQ), first character = (10) 

我不完全肯定這是什麼意思。我看着使用頭的fastq文件:

ha5c6n8$ head FR0826_S1_L004_R1_001.fastq 

@NS500289:18:H1237BGXX:4:11401:2791:1023 1:N:0:1 
NCTACATTGGTTCCTCAGCCAAGCACATACACCAAATGTCTGAACCTGCGGTACCTCTCGTACTGAGCAGGATT 
+ 
#<<AAFAFFFAFFFFF7FF)FF.F<FAFFFFF<FF.AFFF7F.F.FFAFFFF)7AF7F<FFF<<F7FFFFFF7F 
@NS500289:18:H1237BGXX:4:11401:19266:1023 1:N:0:1 
NAATGGGTCTGCGAGAGCGCCAGCTATCCTGAGGGAAACTTCGGAGGGGGCCGGCTACTAGATGGTTCGCTTAGT 
+ 
#<7AAFAFFFFFFFF7FFAA.AFF<F...<AFFFF7F..FA.A<AA<F7)FA7.FF.<FA..F.A7AF..FFF.A 
@NS500289:18:H1237BGXX:4:11401:6297:1023 1:N:0:1 
NATAAGAGGGGTGTGGCTAGGCTAAGCGTTTTGAGCTGCATTGCTGCGTGCTTGATGCTTGTCCCTTTTGATCGT 

據我所知,這看起來像一個完全正常的fastq格式文件。任何人都可以解釋什麼導致這個錯誤? 謝謝!

+0

在我看來,這個問題不太適合於stackoverflow。如果我是你,我會開始用fastq驗證器檢查你的fastq文件進行調試,看看是否有警告和錯誤。您的文件可能例如被截斷,我們無法從前幾行看到這一點。 – cel 2014-08-29 08:05:17

回答

0

你的fastq文件以一個不允許的新行開頭(ASCII值爲10)。刪除第一行,它應該是確定的。

相關問題