2013-07-10 42 views
2

我是新來的Perl,所以我沒有經驗使用它,我要提取使用TWIG和Perl從下面的XML文件裏面CDATA內容CDATA內容提取與嫩枝:如何使用Perl

<?xml version='1.0' encoding="utf-8"?> 
    <text> 
    <![CDATA[ 
    1. Democracia ukata Estado de Derecho sutinchata kamachinaka ch’amanchañataki 

    ... 
    ]]> 
    </text> 

對不起,如果這個問題重複的地方。 在此先感謝。

回答

6

使用twig_handlers進行過濾,使用#CDATA作爲xpath表達式。

內容script.pl

#!/usr/bin/env perl 

use warnings; 
use strict; 
use XML::Twig; 

my $twig = XML::Twig->new( 
    twig_handlers => { 
     '#CDATA' => sub { print $_->text }, 
    }, 
)->parsefile(shift); 

運行它想:

perl script.pl xmlfile 

國債收益率:

1. Democracia ukata Estado de Derecho sutinchata kamachinaka ch’amanchañataki 

...