2017-08-31 56 views
-2

我有一個GFF3文件,在文件底部有一個FASTA基因組報告。 I have attached an image of what I mean如何刪除文件中某個點以下的所有內容。

我想刪除'## FASTA'一行下面的所有內容 - 包括該行。 我需要爲多個文件執行此操作。 請幫忙。

+2

如果你的問題1)它包括輸入和期望輸出的文本版本,2)嘗試。否則它只是個性化的幫助,而SO不是那個網站。 –

+0

我可以讓它成爲一個文本文件。在圖片中你可以看到 - 我想刪除## FASTA下面的所有內容 –

回答

0

請修改您的問題以包含您正在討論的數據的樣本。這不是一個特別好的方式來問人們的東西。我們不需要整個文件,只是文本中的重要代碼片段。

該圖像令人討厭的原因有很多,但最讓我困擾的是imgur圖像可能因爲超出stackoverflow的原因而被刪除。那麼你的問題就變得毫無用處。


你可以做這樣的事情:

# Read the file into a list 
myfile = "path/to/file.fastq" 
f = open(myfile,"r") 
lines = f.readlines() 
f.close() 

# Reopen the file to write 
f = open(myfile,"w") 
FASTA=False 
# Iterate over all the lines 
for line in lines: 
    # Set the flag if we reach the FASTA line 
    if line == "##FASTA\n": 
     FASTA = True 
    # The FASTA flag causes the lines to be skipped 
    if FASTA: 
     continue/break 
    # Write the line to the file 
    f.write(line) 

f.close() 

如果你能確定你不需要的文件的其餘部分也break圈外,而不是continue的可能。繼續它仍然通過所有行,即使找到##FASTA,所以這很好,如果你可能會發現更多的可用數據。

相關問題