轉述原題:動態刮解析
我知道一個良好的數額PHP,JS,CSS,OOP和使用vim編輯器的NETRW和elinks插件下載一系列的最近磨練我的正則表達式技巧網頁(大約一百萬行)被解析並準備上傳到我的網站。我使用的是linux/ubuntu系統,本地主機設置,這個特定的項目正在實現Concrete5 cms - 這是用PHP編寫的。
看到抓取和解析信息的好處,我想讓我的網站動態執行此功能,儘管規模小得多;例如,使我的新用戶能夠將他們的個人信息從另一個網站轉移到我的網站中 - 這通常會處於安全連接(儘管不總是)和密碼之下。
問題:什麼是最好的工具(腳本語言)用於此?我不知道Perl或Ruby,但我相信其中任何一個都是不錯的選擇。我也聽說AWK和SED。我確信一旦我開始學習這門語言,我就可以弄清楚如何去做。我真的很感謝一些經驗豐富的投入,在哪些語言是最好的開始投入我的時間來學習它。
感謝您的幫助。
描述太模糊,難以理解你想要達到什麼目標,其系統是否涉及,數據從哪裏到哪裏。你忽略瞭解釋Netra和netrw。 - 無需使用編輯器就可以自動進行網站搜索/解析,事實上,Perl和Ruby在這項任務中表現突出。 [堆棧溢出是爲了特定問題](http://stackoverflow.com/faq#questions),把你的問題分解成小塊。 – daxim 2012-01-13 16:03:28
爲什麼你用vim代替一些腳本語言?或者直接使用'elinks',然後用'sed'解析輸出?雖然vim可能有可能,但有更好的工具來做這種事情。 – 2012-01-13 16:07:06
你在標籤中說「perl」。爲什麼不使用LWP和HTML :: Parser? – ZyX 2012-01-13 16:21:03