0

我真誠地道歉,如果這不是討論這個問題的合適論壇,但我不確定要去哪裏或什麼是最好的選擇。獲得老兵事務醫院數據庫友好列表的最佳方式

基本上,我試圖找到一個數據庫友好的老牌醫院名單。我已經能夠找到最接近的是www.va.gov/ofcadmin/docs/CATB.pdf,因爲它擁有所有我在尋找的信息:

  • 地區
  • 地址
  • 市中單獨列單獨的列
  • 郵編
  • 國家
  • 設施#(也稱爲的stationID)
  • VISN
  • 符號

我已經嘗試將該PDF導出到CSV中,但這是一個完成工作的噩夢。所以,我很好奇,如果有人對我如何完成這項任務有任何想法或見解。

回答

1

首先,這是一個包含在CATB.pdf中找到的數據的CSV文件。第一行包含列標題,文件的其餘部分包含內容。現在

http://tmp.alexloney.com/CATB.csv

,對於更詳細的解釋...我把你提供的鏈接到PDF,它轉換成使用Adobe Acrobat一個HTML文件,然後我用了很多的Regular Expressions解析文件並清理它。一旦文件被清理完畢,我就能夠編寫一個程序來解析文件的其餘部分,獲取狀態和區域,然後以一個格式良好的CSV將其全部吐出。

希望能幫到你!

+0

哇,謝謝。老實說從來沒有想過我會得到那麼多的幫助。謝謝! – ajtatum 2012-07-13 17:40:30

+0

沒問題,我很高興你覺得它有用! – Alex 2012-07-13 21:09:03

0

我相信PDFILL有一個選項可以將PDF文件轉換爲Excell。一旦進入Excell,你應該沒有問題轉換爲CSV文件。

相關問題