我正在創建一個我希望「普通」用戶能夠使用的Web爬取應用程序。我擔心的是,對於大多數用戶來說,網絡爬蟲應用程序可能太複雜了,但因爲用戶需要:如何製作Web抓取應用程序用戶友好的
- 瞭解URL結構(域,路徑等)。
- 瞭解抓取「深度」。
- 瞭解文件擴展名,並能夠設置「過濾器」來縮小爬網以獲得更好的性能(或者他們會對程序感到沮喪)。
- 瞭解在網頁中找到哪些網址(圖片srcs,鏈接,純文本網址等)。
如何才能幫助用戶快速熟悉我的程序?或者甚至更好,我能做些什麼,程序足夠直觀,用戶只需'明白'?我知道這看起來相當寬泛,但如果您可以將您的答案限制在網絡抓取工具這應該有所幫助,那麼。我已經閱讀了一般可用性,UI設計等,但我正在努力與我工作的領域。謝謝。
謝謝!我非常喜歡簡單/高級選項設置的想法。我認爲這是最深遠的想法。設置明智的默認設置通常會找到用戶正在尋找的內容,並且通常會提供良好的性能,這將會非常棘手,但我認爲這是正確的做法。至於文件擴展名:我已經按照你的建議對它們進行了分組,但我允許用戶輸入/刪除分組的擴展名(例如,也許用戶需要jpgs而不是gif)。至於#4:這是一個性能問題,可能會導致等待幾分鐘或等待幾個小時才能完成抓取工作。 – Chad 2010-06-29 03:35:39