真的很基本的問題,但我不能得到這個工作。我的示例文本位於頁面底部。查找並替換下一個和下一個,而不是找到第一個和最後一個
我想要的唯一一行是這樣的:「178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95」。我目前在OSX上使用TextWrangler(終端和我不是朋友),它們提供了正則表達式替換。 我試圖在步驟中做到這一點,我的第一步是試圖擺脫所有的蛋白質序列。
在的TextWrangler,我搜索該:
工作序列([^] *)----------------------- -------------------------------------
而且什麼也不換。然而,我最終得到的幾乎是一個空文檔,因爲TextWrangler似乎找到了「工作序列」的第一個實例,但最後一個「----------------- -------------------------------------------」。我該如何改變,所以這是一個逐步的過程,找到兩者的第一個實例並用什麼都替換,然後是第二個實例等?
感謝和問候來自瑞典
結果總結爲蛋白質:SP | P08195 | 4F2_HUMAN 4F2 GN = SLC3A2 PE = 1 SV = 3個 易位子TM分析結果 分區:水到雙層 窗口範圍: 19-30
易位子TM數量預測段:2
178-207 30 WVRTRWALLLLFWLGWLGMLAGAVVIIVRA -3,95
438-460 23 ARLLTSFLPAQLLRLYQLMLFTL 1,63
工作序列長度= 630):
MELQPPEASIAVVSIPRQLPGShSEAGVQGLSAGDDSELGShCVAQTGLELLASGDPLPS ASQNAEMIETGSDCVTQAGLQLLASSDPPALASKNAEVTGTMSQDTEVDMKEVELNELEP EKQPMNAASGAAMSLAGAEKNGLVKIKVAEDEAEAAAAAKFTGLSKEELLKVAGSPGWVR TRWALLLLFWLGWLGMLAGAVVIIVRAPRCRELPAQKWWhTGALYRIGDLQAFQGhGAGN LAGLKGRLDYLSSLKVKGLVLGPIhKNQKDDVAQTDLLQIDPNFGSKEDFDSLLQSAKKK SIRVILDLTPNYRGENSWFSTQVDTVATKVKDALEFWLQAGVDGFQVRDIENLKDASSFL AEWQNITKGFSEDRLLIAGTNSSDLQQILSLLESNKDLLLTSSYLSDSGSTGEhTKSLVT QYLNATGNRWCSWSLSQARLLTSFLPAQLLRLYQLMLFTLPGTPVFSYGDEIGLDAAALP GQPMEAPVMLWDESSFPDIPGAVSANMTVKGQSEDPGSLLSLFRRLSDQRSKERSLLhGD FhAFSAGPGLFSYIRhWDQNERFLVVLNFGDVGLSAGLQASDLPASASLPAKADLLLSTQ PGREEGSPLELERLKLEPhEGLLLRFPYAA
用於蛋白質結果總結:SP | Q9NPC4 | A4GAT_HUMAN OS =智人GN = A4GALT PE = 2 SV = 1個 易位子TM分析結果 分區:水到雙層 窗口範圍:19-30
易位TM預測片段數量:1
19-43 25 RVCTLFIIGFKFTFFVSIMIYWhVV -1,04
工作序列長度= 353):
MSKPPDLLLRLLRGAPRQRVCTLFIIGFKFTFFVSIMIYWhVVGEPKEKGQLYNLPAEIP CPTLTPPTPPShGPTPGNIFFLETSDRTNPNFLFMCSVESAARThPEShVLVLMKGLPGG NASLPRhLGISLLSCFPNVQMLPLDLRELFRDTPLADWYAAVQGRWEPYLLPVLSDASRI ALMWKFGGIYLDTDFIVLKNLRNLTNVLGTQSRYVLNGAFLAFERRhEFMALCMRDFVDh YNGWIWGhQGPQLLTRVFKKWCSIRSLAESRACRGVTTLPPEAFYPIPWQDWKKYFEDIN PEELPRLLSATYAVhVWNKKSQGTRFEATSRALLAQLhARYCPTThEAMKMYL