我需要從在線時間表(針對學校)中提取教程到數組中。所以我可以將數據插入到我的數據庫中。在線時間表(網址:roosters-hd.stenden.com)看起來像這樣:將HTML表格元素提取到數組中
在左邊我們看到時間,並在頂部的學生(Mo,Tu,We,Th,Fr)。非常基本。
除此之外,我還需要獲取[startDate]和[endDate]。時間基於課程單元所在的行以及它的行數。日期可以通過將列號添加到開始日期(打印在頂部)來計算。 那麼到底該數組將是這個樣子:
[0] => Array
(
[0] => Array
(
[Name] => Financiering
[Type] => WC
[Code] => DECBE3
[Classroom] => E2.053 - leslokaal
[Teacher] => Verboeket, Erik (E)
[Class] => BE1F, BE1B, BE1A
[StartDate] => 04/06/2013 08:30:00
[EndDate] => 04/06/2013 10:00:00
)
etc.
因爲我缺乏在取數據的經驗,我會適當地被非常低效和不靈活的解決方案告終。像我應該使用XML解析器?或正則表達式?關於如何解決這個問題的任何想法?
請** **不是正則表達式! http://stackoverflow.com/a/1732454/2170192 –
是不是正則表達式,正則表達式是用於解析字符串,它是非常強大的,但它仍然不應該用於這種解析。還鏈接你發佈返回400個不好的請求。這將是很好的看到現場的例子,你可以把它放在jsfiddle.net –
固定鏈接。 我現在沒有任何例子,因爲我不知道我應該從哪裏開始。我的意思是,提取數據的正確有效方法。 – JasperJ