2016-12-12 63 views
0

我想在java中建立一個搜索引擎,我有一個文件夾「爬蟲」來存儲下載,但是當我打開我的項目,然後單擊該文件我的計算機卡住因爲它試圖加載從html頁面(100k +)解析的所有URL和文本,並嘗試在「crawler」文件夾中的.txt文件中顯示它們。HTML頁面加載並顯示在.txt文件

如何防止加載並在文件中顯示它們?

回答

1

將您的數據文件存儲在項目之外的某個位置。使用例如屬性文件將位置存儲到您的搜尋器文件夾。您應該只將這些文件包含在您的項目中,如源代碼。你會上傳到Git或SVN的東西。不是您的應用程序運行的數據文件。如果要將這些數據存儲在數據庫中,則不會將整個數據庫包含在項目中,而只包括用於創建表和視圖的SQL文件。