2011-08-26 87 views
0

假設我創建數據的圖表:歷史圖表編號?

1/1/2001 1 
1/2/2001 2 
1/3/2001 2 
1/4/2001 5 
1/5/2001 1 
1/6/2001 7 
... 

它可能看起來像這樣:

| 
|   x  x 
|     
|   
| x x  
|x    x 
|   
|------------------------> 

現在我使用它創建一個圖形,然後我失去了數據的關鍵。你怎麼能打開回鎖的圖表信息? Tessarec有沒有一些OCR軟件可以做到這一點?如果我本人要這樣做,我該怎麼做?

從ASCII解決這個問題比上面更容易,我知道如何用它做這項工作。但是,我如何處理不是ASCII碼的圖片呢? format-ASCII -converters,然後用正則表達式匹配來分析圖片?其他工具?哪些工具?

+1

也許相關[這裏](http://unix.stackexchange.com/questions/5316/which-tools-for-ascii-portfolio-visualization)。 – hhh

回答

0

我的一位同事做了一個類似於DataThief的軟件,所以你可能想嘗試一下。我沒有親自使用它,但它似乎能夠完成這項工作。

1

如果圖形存在作爲光柵圖像和不雜亂與文本或剪貼畫,則一個小程序沿着這些路線:

image = Image.open("image.gif") 
for x in x_axis_range: 
    for y in y_axis_range: 
     if image.getpixel((y,x)) == BLACK: 
     data_point[scale_x(x)] = scale_y(y) 

調整x_axis_range和y_axis_range不包括軸系。 調整函數scale_x和scale_y以匹配實際的軸比例。 調整黑色測試以適應圖像壓縮造成的錯誤。

+0

如果有大量不同尺寸或縮放比例的圖像,這種手動調整算法的方法可能不實用。 –

+0

上面的代碼是一個使用PIL(Python Imaging Library)的python代碼片段,但它也是您選擇的語言的僞代碼。 –