2014-02-21 26 views
2

我是antlr的新手,並且正在爲DSL編寫antlr語法。我跳過了空白處理它。但在這裏我想可選語法我拿起一個特定的令牌可能,我想在這裏實現的方式白色space.The事情的情況下被允許我的antlr語法令牌中的空白

  1. 令牌SECATTR 有空格與修剪尾隨和領導spaces.That是一樣的東西
    AA aa_aa aa.aa aa_aa AA沒有解析規則 的排序COUNT(aa aa_aa aa.aa aa_aa aa )>10 singlerule使用時導致空間被理解爲單一標記。 截至目前正在形成的樹就像是 The token SECATTR having spaces in lead

  2. 解決我的分析規則有空間的問題singleruleCOUNT (aa aa_aa aa.aa aa_aa aa)>10COUNT這就好比single rule with spaces拋出一個錯誤,由於空間

  3. 避免笨拙解析(如果實現)我的令牌SECATTR,因爲它目前以下列方式被解析爲AA AA _aa aa.aa aa_aa AA(我認爲這是一切的根本原因)Multiple breakdown of SECATTR

我需要處理所有這些空格的認​​真,因爲我的其他解析規則EXPR是複雜的,基於singlerule和我的最終目標是讓乾淨的方式允許標記的SECATTR有空白和所有其他地方whitespaces被忽略。請建議我在哪裏出錯,需要改進的地方。

grammar Test; 

options { 
    language = Java; 
} 


fragment DIVIDE : '/'; 
fragment PLUS : '+'; 
fragment MINUS : '-'; 
fragment STAR : '*'; 
fragment MOD : '%'; 
LPAREN : '('; 
RPAREN : ')'; 
fragment COMMA : ','; 
fragment COLON : ':'; 
fragment LANGLEBRACKET : '<'; 
fragment RANGLEBRACKET : '>'; 
fragment EQ : '='; 
fragment NOT : '!'; 
fragment UNDERSCORE : '_'; 
fragment DOT : '.'; 
fragment GRTRTHANEQTO : RANGLEBRACKET EQ; 
fragment LESSTHANEQTO : LANGLEBRACKET EQ; 
fragment NOTEQ  : NOT EQ; 

WS  :   ('\t'|'\f'|'\n'|'\r'|' ')+{ $channel=HIDDEN; }; 

fragment A:('a'|'A'); 
fragment B:('b'|'B'); 
fragment C:('c'|'C'); 
fragment D:('d'|'D'); 
fragment E:('e'|'E'); 
fragment F:('f'|'F'); 
fragment G:('g'|'G'); 
fragment H:('h'|'H'); 
fragment I:('i'|'I'); 
fragment J:('j'|'J'); 
fragment K:('k'|'K'); 
fragment L:('l'|'L'); 
fragment M:('m'|'M'); 
fragment N:('n'|'N'); 
fragment O:('o'|'O'); 
fragment P:('p'|'P'); 
fragment Q:('q'|'Q'); 
fragment R:('r'|'R'); 
fragment S:('s'|'S'); 
fragment T:('t'|'T'); 
fragment U:('u'|'U'); 
fragment V:('v'|'V'); 
fragment W:('w'|'W'); 
fragment X:('x'|'X'); 
fragment Y:('y'|'Y'); 
fragment Z:('z'|'Z'); 


OP1 : ((C O U N T | A V G | C O U N T D I S T I N C T) 
     | C A S T) ; 

OP2 : DIVIDE|PLUS|MINUS|STAR|MOD 
     |LANGLEBRACKET|RANGLEBRACKET|EQ|GRTRTHANEQTO|LESSTHANEQTO|NOTEQ 
     |E Q U A L S | L I K E | N O T E Q U A L S | N O T L I K E | N O T N U L L; 

OP3 : ((C O R R E S P O N D I N G | A N Y)|I); 
OP4 : (A N D | O R); 

DIGIT : ('0'..'9')+; 
fragment Letter : ('a'..'z' | 'A'..'Z')+; 
fragment Space : ' '+; 
SECATTR :Letter (Letter|UNDERSCORE|DOT|Space)+ 
     ; 


singlerule : SECATTR OP2 (DIGIT|Letter) 
       | OP1 LPAREN SECATTR RPAREN OP2 (DIGIT|Letter) 
       | SECATTR OP2 SECATTR 
       | OP1 LPAREN SECATTR RPAREN OP2 OP1 LPAREN SECATTR RPAREN 
; 
expr :((LPAREN? singlerule RPAREN?) OP4?)+ 
     |((LPAREN (LPAREN singlerule RPAREN) OP4 (LPAREN singlerule RPAREN) RPAREN)+ (OP4 (LPAREN? singlerule RPAREN?))+ OP4?)+ 
     | (LPAREN (LPAREN singlerule RPAREN) OP4 (LPAREN singlerule RPAREN) RPAREN OP3)+; 

回答

0

ANTLR 3和4具有稱爲令牌通道的功能。您可以將您的空白/評論等發送到不同頻道的解析器。它們在令牌流中供使用,但不被解析器解析。

+1

請您詳細說明一下嗎?我很抱歉,我是新來的ANTLR –

+0

https://theantlrguy.atlassian.net/wiki/display/ANTLR4/Lexer+Rules#LexerRules-channel() –

+1

我想我通過做'{$ channel = HIDDEN; };' –