0
A
回答
2
其保存爲bat文件(即innerTextGet.bat
):
@if (@X)==(@Y) @end /* JScript comment
@echo off
cscript //E:JScript //nologo "%~f0" %*
::pause
exit /b %errorlevel%
@if (@X)==(@Y) @end JScript comment */
var link=WScript.Arguments.Item(0);
var saveTo=WScript.Arguments.Item(1);
var IE = new ActiveXObject("InternetExplorer.Application");
IE.Visible=false;
IE.Navigate2(link);
function sleep(milliseconds) {
var start = new Date().getTime();
for (var i = 0; i < 1e7; i++) {
if ((new Date().getTime() - start) > milliseconds){
break;
}
}
}
var counter=0;
while (IE.Busy && counter<60*60*10) {
//WScript.Echo(IE.Busy);
sleep(1000);
counter++;
}
if(IE.Busy){
WScript.Echo("Cant wait 4ever");
WScript.Quit(10);
}
function writeContent(file,content) {
var ado = WScript.CreateObject("ADODB.Stream");
ado.Type = 2; // adTypeText = 2
ado.CharSet = "iso-8859-1"; // right code page for output (no adjustments)
//ado.Mode=2;
ado.Open();
ado.WriteText(content);
ado.SaveToFile(file, 2);
ado.Close();
}
var innerText=IE.document.body.innerText;
IE.Quit();
writeContent(saveTo,innerText);
而且使用它像:
call innerTextGet.bat "https://stackoverflow.com/questions/46611374/save-texts-on-webpages-1000-pages" result.txt
這不是故障安全 - 不檢查結果文件已如果存在參數被正確地傳遞等等,但它至少起作用。它再次使用innerText
屬性InternetExplorer.Application
對象由建議@omegastripes雖然我preffer jscript因爲它更容易被插入批處理文件。
由於您沒有提供關於鏈接存儲位置的信息,我假設您知道如何閱讀並遍歷它們。
相關問題
- 1. 在Android上保存網頁
- 2. PowerShell保存IE網頁文本
- 3. 保存網頁
- 4. 保存網頁
- 5. 渲染1000+ DIV在網頁
- 6. 在網頁上運行perl腳本後保存文件
- 7. 可以在網頁上編輯和保存的文本
- 8. 在android中保存網頁
- 9. 如何保存網頁上自動提示文本框的值?
- 10. 將網頁上的文本保存爲字符串變量
- 11. 在網頁上顯示中文文本
- 12. 解析網頁而不保存本地?
- 13. 如何在網頁抓取後保存結果文本
- 14. 在一個循環中保存文本框的值(asp.net網頁)
- 15. 保存圖片在網頁API文件系統上
- 16. 在網頁瀏覽器上顯示保存的文件
- 17. 在Asp.net網頁上顯示保存文件對話框
- 18. 在網頁上的數據庫中顯示保存的文檔
- 19. 保存網頁時未保存圖像!
- 20. 在網頁上錄製,保存和播放保存的聲音文件
- 21. 將網頁保存爲Word文檔? (VB.NET)
- 22. 將網頁保存爲MHTM文件
- 23. 在網頁上隱藏特定文本
- 24. Haml在網頁上生成「{}」文本
- 25. 在網頁上的垂直文本
- 26. 在網頁上搜索文本
- 27. 在網頁上使用本地文件
- 28. 在網頁上循環移動文本
- 29. 下載一個網頁並保存爲UTF-8文本文件
- 30. Python來保存網頁
檢查[這個答案](https://stackoverflow.com/a/21490198/2165759) – omegastripes
'lynx'也許? http://lynx.browser.org –
@MarkSetchell - l is是古老的,無法呈現JavaScript。現代的選擇是phantomjs – npocmaka