2017-01-20 29 views
1

我有一個自我生成的HTML文件(在本地目錄)的所有身體上一行:PowerShell的:拆分HTML

<html><head><META http-equiv="Content-Type" content="text/html; charset=UTF-8"><title>server - path</title></head><body><H1>server - path</H1><hr> 

<pre><A HREF="/logs/folder/">[To Parent Directory]</A><br><br>   jeudi 5 janvier 2017 19:38  116483 <A HREF="/folder/file1.csv">file1.csv</A><br>   jeudi 5 janvier 2017 19:39  138397 <A HREF="/folder/file2.csv">file2.csv</A></A><br></pre><hr></body></html> 

,我需要提取的文件和日期的名稱。 我成功閱讀了正確的文字。但我被阻止在<br>上劃分線路。

我嘗試這樣:

$string = "first line<br>second line <br> third line<br> end<br>" 
write-host $string 
$separator = "<br>" 
$option = [System.StringSplitOptions]::RemoveEmptyEntries 
$string.Split($separator, $option) 

但我對於結果:

first line<br>second line <br> third line<br> end<br> 
fi 
st line 
second line 
thi 
d line 
end 

我看到HTML敏捷性包,但對我來說,我沒有任何標籤在我的頁面。

你有什麼建議嗎? 謝謝!

+0

這個職位似乎是回答你的問題: http://stackoverflow.com/questions/16435240 /如何對分割串逐串合的powershell – c3st7n

回答

2

String.Split() method需要你的字符串<br>,並把它當作一個[char]陣列,分裂對任何<br>每一個發生。

使用基於正則表達式,-split操盤手:

PS C:\> $String -split $separator |Where-Object {$_} 
first line 
second line 
third line 
end 

Where-Object {$_}管道元件會過濾掉空字符串