2011-08-29 30 views
1

解析AppleScript中的HTML的好方法是什麼?解析AppleScript中的HTML

我在一段時間內還沒有涉足AppleScript,甚至當我做到這一點時,它是非常小的和不受影響的,所以我現在還沒有真正地在語言中自然地思考。但我需要做一些字符串操作並解析一些HTML(基本上是一些簡單的屏幕抓取)。當然,我想避免common pitfalls of HTML parsing。但是,這是一個臨時腳本,不需要特別強大或可支持。我真的只需要將特定的子字符串(從已知的開始子字符串到下一個已知字符)擦除到文件中。

我已經在C#和類似語言中做了大量的字符串處理,但AppleScript是一個有趣的改變,至少可以說是一種有趣的改變。有人可以指點我一些很好的資源(關於這個問題的谷歌搜索似乎有很高的噪音與信號比率),或者幫我拿出一些示例代碼片段?

我正在做的最終目標是採取預先確定的頁面列表,在Safari中打開每個頁面(我正在通過tell application "Safari"做所有事情),解析出符合特定模式的鏈接,並存儲文件中的所有這些鏈接。 然後通過該文件,打開每個鏈接,解析出更多適合其他模式的鏈接,並將所有這些鏈接存儲在文件中。 (這個網站實際上是由我們一起工作的人所有,所以不要擔心我違反任何服務條款或類似的事情,但由於這個問題的範圍之外的原因,我正在做一些在AppleScript中抓取頁面。)

回答

1

我不能說關於Matt Neuburg's AppleScript: the Definitive Guide的好東西。毫無疑問,AppleScript的最完整文檔已經完成。馬特也是我最喜歡的科技作家之一。

+0

我應該考慮檢查O'Reilly,他們在我的UNIX開發日總是很好。我可以在今年的工作簿預算中加上這個。謝謝! – David

1

我也會看看this article。它包含一個關於如何做到這一點的教程;這裏提供的示例僅解析來自一個源的HTML數據,但我認爲值得一看。