快速Perl問題,希望有一個簡單的答案。我試圖對包含非中斷空格的字符串執行分割(
)。這是使用HTML::TreeBuilder::XPath
閱讀在html
頁面和檢索由$titleString = $tree->findvalue('/html/head/title')
在字符實體引用的Perl拆分字符串
use HTML::TreeBuilder::XPath;
$tree = HTML::TreeBuilder::XPath->new;
$tree->parse_file("filename");
$titleString = $tree->findvalue('/html/head/title');
print "$titleString\n";
下面需要粘貼後的字符串是原始字符串,低於該被打印的字符串:
Mr Dan Perkins (Active)
Mr?Dan Perkins?(Active)
我試着拆分$titleString
與@parts = split('\?',$titleString);
,也與原始nbsp
,雖然都沒有工作。我的直覺是,有一個簡單的編碼代碼被添加到某個地方?
HTML代碼:
<html>
<head>
<title>Dan Perkins (Active)</title>
</head>
</html>
它是「&nbsp」或「 」?那些是不同的。你可以添加原始網站,還是本地? – simbabque
對不起,這是一個本地html頁面,但我會將html添加到問題中。這是' ' - 抱歉沒有看到。 –