2012-01-15 35 views
-2

我有一個Tex文件。我想用C#將其轉換爲txt文件。 請幫忙。 我確定它包含的信息是純文本,但使用的格式是Tex。Tex到txt轉換使用C#

+0

Tex文件是否已經以純文本格式? – zellio 2012-01-15 19:11:00

+0

@Mimisbrunnr:No;它通常只能使用ASCII字符,但它不是純文本格式。 – dreamlax 2012-01-15 19:15:29

回答

0

TeX文件需要完全解釋,才能可靠地提取任何類型的文本。在C#中編寫一個完整的TeX解釋器可能是一項真正的任務,所以我建議使用現有的解釋器來輸出可以更容易解析的格式,例如HTML。

你可能會覺得傾向於寫一個正則表達式來簡單地去掉所有的\command,但是這不會給你一個非常準確的結果,因爲有些命令產生自己的文本,並且[不太常見]一些命令捕獲文本跟隨它。此外,您將遇到字符更改類別代碼的問題,某些字符可能處於活動類別代碼中,這意味着字符本身可能是命令。