我需要解析以下字符串(解析PDF,希望避免第三方包)。解析爲基於多個分隔符的數組
/類型/頁/多媒體[0 0 612 792] /計數9 /兒童[5 0 R 355 0 R]
我使用Javascript:
String.split(' ');
的輸出我想得到的是[ '/類型', '/頁數', '/媒體框', '[0 0 612 792]', '/計數', '9', 「/孩子, '[5 0 R 355 0 R]' ]
這導致:以下輸出:[ '< <', '/類型', '/頁數', '/媒體框' , '[0', '0', '612', '792]',
具體而言,我想限定 '[' 和 ']'。使帶子會讀「[5,0,R,355,0,R]」
預計,最終結果是這樣的:
我想看看我是否可以用正則表達式解決這一問題及目前我被卡住了。
您知道示例中的大部分空格是可選的嗎?這些鍵值對也可以寫成'/ Type/Pages/MediaBox [0 0 612 792]/Count 9/Kids [5 0 R 355 0 R]'。你的解析思路太簡單了...此外,還可能有註釋行inbetween ... – mkl