在我正在玩的實驗項目中,我希望能夠查看文本數據並檢測它是否包含表格格式的數據。當然,有很多情況可能看起來像表格數據,所以我想知道我需要研究什麼樣的算法來尋找常見的功能。如何檢測來自各種來源的表格數據
我的第一個想法是編寫一個長開關/大小寫語句,檢查由製表符分隔的數據,然後另一種情況是用管道符號分隔數據,然後再用另一種方式分隔數據等等。當然,我意識到我將不得不想出不同的東西來檢測 - 但我想知道是否有一種更智能的方式來檢測這些功能,而不是對每種類型進行相對較慢的搜索。
我意識到這個問題並不是特別雄辯,所以我希望它有一定道理!
任何想法?
(不知道如何標記這兩種 - !所以幫助有歡迎)
第一步是*非常清楚,準確地*定義「表格數據」的含義。這聽起來不像你做到的那樣。 – 2009-11-13 20:40:25