我有一個大文件,我想解析並從中選取文本的片段。下面是該文件的實際例子:如何在Perl中的兩個字符之間從XML中獲取文本
en-US AcceptedText pt="dial:def"Tag u="contact"Mom/Tag/AcceptedText 11373
我想抓住文本的片段是第一"
和:
之間。在上面的情況下,這將是字dial
。
這裏是我已經把劇本:
#!/usr/bin/perl
open (SESAME, '/home/my_name/whereMyFileLives.txt');
while (<SESAME>) {
$text .= $_;
}
close (SESAME);
$text =~ /\n*$/;
$text =~ m/ \" (.*) :> /;
print $text;
當我運行此腳本,它打印的文件到終端完全一樣的文件已經是。它不解析文本並提取我想要解壓縮的文本片段。
任何指針?
由於您的輸入是XML數據,它看起來不像您展示的示例,因爲這不是有效的XML。而且你不應該使用正則表達式來處理XML:如果你使用專門用於該任務的庫,它會更簡單和更安全。如果你發佈更多*實際*數據,並在上下文中顯示,那麼你將得到更好的答案。 – Borodin