2013-08-18 123 views
0

我有一個ruby腳本,它創建一個HTML文件作爲某些字母上色的輸出。用格式創建一個Word文件

例如

<p> 
     <b>>aug3me.g5.t1</b> has a signal p with a cleavage site between positions 19 and 20.<br> 
     <b class="SignalP">MLRSMMLMIAMGCFLNAFG</b>QSGQELE<b class="motif_site">KR</b>VI<b class="motif_site">KNAR</b>QLIYEG<b class="motif_site">KR</b>SGEGYFSKDGK<b class="motif_site">HLIFQSER</b>EEENPYYQIYILDLESGDINRVSPGQGKTTCSYFDWSSDNNVLFGSTHHDPKAKEKQQAELDF<b class="motif_site">RASGKKRR</b>YSWDYDKEMDIFSAN<b class="motif_site">RDGSNVKR</b>ITTEEGYDAEGSYSPDG<b class="motif_site">KK</b>IAFCSLRDAYN<b class="motif_site">KK</b>LSEKEIKTLEVDAAYFGEIYIMDADGSNQ<b class="motif_site">KR</b>LTNVPEPVRITHTDGFDGLPVFSPNGKNIAWTSVRTSD<b class="motif_site">KK</b>SQIFYASWDHQAALSLLKQAPAKGQDAKDPNFTGEIKSDEIKSKVAYLASDELEGRMTGSEGI<b class="motif_site">KK</b>ASDYITGQF<b class="motif_site">KK</b>IGLNSIESREEYLQEFPFVSSVEVNAAGTSFSTTN<b class="motif_site">KK</b>KPKAWVLYENFVPLPFSMNGEFEGEVVFAGYGIKTPDKSEVEYNSYANIEVKDKAVMILFDVPPHFNDDEEKELI<b class="motif_site">RYASPR</b>Y<b class="motif_site">KALVAR</b>ELGAKAVIFISE<b class="motif_site">REREFR</b>GVSKDNVPGNAGILALKVKSDLANEMLKSKETDFEKVKTQFENYNPHSENEFPLPGQTIGITTQLDKVESSDNNVIGILYADEPTDHYLMVGAHYD<b class="motif_site">HLGR</b>GEAGTLAHGEEKEEIHNGADDNASGTAAVMELAEYFVQLKNENPGSLTKNLLFALWSGEEMGLVGSAHYTKQSSKEIEGMDAYLNFDMIGMLNDNKLILQGLGSSPAWNKIVE<b class="motif_site">KK</b>NVAAGFDLTLQDDPYVPTDGMSFYQAGVPMLCFFSGIHDYYH<b class="motif_site">KPTDDIER</b>LNYEGAERIIKFSAEIIKELMKVDTLAYA<b class="motif_site">KVEMVKNR</b>AAGSKGFSVYLGTIPDYVAEVEGV<b class="motif_site">KLSGVR</b>AGGPAEKAVFRPN<b class="motif_site">KALR</b>LYGLNPLRGPH 
    </p> 

通過以上序列,某些殘基(字母)的顏色或其它等着色

我需要一個腳本,使一些類型的文本文件(最好.doc文件)包含所有這些格式。

是否可以創建一個腳本來創建帶格式的word文檔。如果是這樣,我會如何處理這個問題?

回答

1

是的,這是可能的。有困難的方法和簡單的方法。

堅硬方式

使用可以創建使用WordprocessingML中一個的Microsft Word文檔。過去我使用XML樣式表將XML輸出轉換爲模板,在C#中也是從頭構建它們。 (有關格式的更多詳細信息,請參閱http://msdn.microsoft.com/en-us/library/office/aa212812(v=office.11).aspx & http://msdn.microsoft.com/en-us/library/bb264572(v=office.12).aspx)。

如果您可以使用Word中需要的樣式創建模板。將擴展名更改爲.zip並解壓縮。 document.xml是文檔,可以爲您提供基本的XML文件。

簡單的方法

如果HTML文件是「獨立」,包含了所需的所有款式,你可以欺騙,只是給HTML文件一個.doc推廣。 Word會將HTML呈現爲Word文檔。

相關問題