我必須從幾個word文檔(大量的文檔)中獲取內容(一些練習的文本),並對它們進行轉換,以便它們可以加載到Javascript應用程序中。解析word文檔的腳本
的這些字文件的內容的一個例子是:
1.Text問題1
答案1
答案2
答案3
2.Text 問題 2帶一個_ _ _ _ _ _ _或更多。
答案1個
答案2
答案3
等
因此,有這樣一個問題,一個空行一個行,然後3可能的答案線。在這個例子中,我提出了兩個問題,但每個單詞文檔可以有12個以上的問題。請注意,問題文本中的單詞可以用下劃線或粗體顯示。也可能有空格(用幾個_字符表示,中間或不要有空格)。
這些word文檔的輸出格式會是這樣的:
var questions = [
{
label : "1.Text question 1",
options : ["answer 1", "answer 2", "answer 3"],
answer : [1] //Here I will need to set the right answer, probably manually
},
{
label : "1.Text <strong>question</strong> 2",
options : ["answer 1", "answer 2", "answer 3"],
answer : [0] //Here I will need to set the right answer, probably manually
},
etc
];
所以這是在JS一個基本的關聯數組。請注意,「標籤」鍵將以html格式保存問題的文本(因此在此示例中有一個<strong>
標籤可反映第二個問題中的粗體字)。
我在找的是一個腳本,接受輸入一個像文檔一樣的文檔,並且 也輸出一個JS文件,就像我的輸出示例(如果它是一個文本文件也可以)。腳本語言是最好的,如果它是PHP或Javascript。如果我必須在word文檔上做一些工作以適應某些事情以使腳本更容易,那也沒關係。
這對我來說,主要的挑戰是如何保留文本可以具有的所有文本樣式(粗體,下劃線,空格......),否則將它們轉換爲簡單的txt文件,我想會工作...
任何幫助,將不勝感激!
做你嘗試任何事情了嗎? –
你有沒有考慮過先把它們保存爲html。 –