這是一個PDF文件,其中包含特定考試的標記列表。 http://www.megaupload.com/?d=T9VM6P9E從PDF中提取表格數據並對其進行排序
我特別感興趣的第一個列表,但不幸有2112條目。而且它們的格式不正確。我需要對所有這些條目進行排序(基於最後2列中的標記 - 能力和計算機中的標記總和),以瞭解我的排名是什麼。
我試圖在MS Word和Excel中複製,但如果你嘗試它,你可以看到它不會幫助。在將它粘貼到一個純文本文件中後,我嘗試使用正則表達式(在Notepad ++中)對其進行格式化,在C中編寫代碼以正確分隔每個字段'\ t'(以便稍後我可以將它們正確地複製到Excel工作表中),但不一致性使我失敗(某些條目產生多行,「名稱」沒有固定的字段數)。
有人可以提出任何想法,將PDF格式的第一個列表以原始文件的形式複製到電子表格中嗎?
我非常需要對此進行排序,任何幫助將不勝感激。 :)
謝謝desertverge,但你能夠規定確切的程序?我不太熟悉PDF文件格式和東西... 我試過pdftk解壓縮它,但它說它無法打開PDF文件。我實際上正在盡我所能對列表進行排序,所以沒有多少時間閱讀文檔。稍後會看到它。不管怎麼說,還是要謝謝你。 :) – Ninad 2010-05-10 15:46:58