2016-01-28 27 views
-1

你好,感謝閱讀PDF文件,如何分析像這樣的JavaScript/JSON數據

我需要能夠解析幾個PDF文件使用這種格式:http://www.buenosaires.gob.ar/sites/gcaba/files/modulo_a_motos_espanol.pdf

爲JavaScript「問題」的對象。正如您可以注意到的是一個包含驅動器許可證多選題考試中的問題的PDF,我需要使用它來做考試模擬器。

我需要爲每一個問題對象,問題本身,三個答案......與硬質部....正確答案(淺藍色彩色),如果存在關聯的圖像。

任何幫助或方向將不勝感激!我使用java和js工作。

回答

2

那誠實看起來像一個非常難以解決的問題。

存在與解析PDF文件以JSON涉及至少一個GitHub的項目,但它僅是從服務器端(使用的NodeJS):

https://github.com/modesty/pdf2json

處理解析用的NodeJS文檔後(這您可能會或可能不會使用)下一個障礙是所選答案的粗體不會顯示在JSON中。爲了確定選擇的答案,需要進行其他角色更改。

這是與其他幾個答覆過類似的問題還有:

How? Parser PDF to Javascript Array?