2010-06-27 113 views
0

我正在創建一個我希望「普通」用戶能夠使用的Web爬取應用程序。我擔心的是,對於大多數用戶來說,網絡爬蟲應用程序可能太複雜了,但因爲用戶需要:如何製作Web抓取應用程序用戶友好的

  1. 瞭解URL結構(域,路徑等)。
  2. 瞭解抓取「深度」。
  3. 瞭解文件擴展名,並能夠設置「過濾器」來縮小爬網以獲得更好的性能(或者他們會對程序感到沮喪)。
  4. 瞭解在網頁中找到哪些網址(圖片srcs,鏈接,純文本網址等)。

如何才能幫助用戶快速熟悉我的程序?或者甚至更好,我能做些什麼,程序足夠直觀,用戶只需'明白'?我知道這看起來相當寬泛,但如果您可以將您的答案限制在網絡抓取工具這應該有所幫助,那麼。我已經閱讀了一般可用性,UI設計等,但我正在努力與我工作的領域。謝謝。

回答

1

僅僅因爲一個網絡爬蟲實施起來很複雜,並不意味着它的使用很複雜。只提供真正必要的,其餘的使用合理的默認值。這將爲您帶來80%的用例,然後依靠另外20%的用戶更願意有更深入的瞭解。

  1. 他們爲什麼要理解這個?取決於預期的使用情況,但我會假設在爬行整個網站時使用的最多,因此只需要域。
  2. Gert G對擴展文件夾結構滑塊的建議是一個不錯的選擇。這個網站不一定是動態的,只是說明它的含義。
  3. 忘記暴露文件擴展名,而是提供帶圖標的常見文件類型,甚至可能將它們分組(例如,所有常見圖像類型,jpg,png,gif,進入一個'圖像'類型)。只需在高級配置部分提供原始文件擴展名設置,那些需要它的人就會理解它。
  4. 我真的不明白爲什麼他們需要了解這一點?當然,這是履帶工的工作。
+0

謝謝!我非常喜歡簡單/高級選項設置的想法。我認爲這是最深遠的想法。設置明智的默認設置通常會找到用戶正在尋找的內容,並且通常會提供良好的性能,這將會非常棘手,但我認爲這是正確的做法。至於文件擴展名:我已經按照你的建議對它們進行了分組,但我允許用戶輸入/刪除分組的擴展名(例如,也許用戶需要jpgs而不是gif)。至於#4:這是一個性能問題,可能會導致等待幾分鐘或等待幾個小時才能完成抓取工作。 – Chad 2010-06-29 03:35:39

1

一些想法:

  • 製作的交互式用戶界面(例如,對於深度的滑塊,其示出了文件夾和子文件夾打開的小圖片,因爲它們將滑塊移動)
  • 避免混亂。將設置分成邏輯選項卡。
  • 製作視頻教程,您需要教他們的東西。
1

也許你可以有一個「網絡」的圖片,顯示兩個或三個網頁,每兩個或三個網站。當用戶選擇在哪裏查找鏈接(例如,圖像,純文本,鏈接等)時,他們選擇的頁面部分將在圖像中高亮顯示。

相關問題