4
我使用google-diff-match-patch來比較自然語言中的純文本。如何在google-diff-match-patch中做差異時忽略某些字符?
如何讓Google-diff-match-patch忽略某些字符? (一些微小的差異,我不關心。)
例如,給定文本1:
give me a cup of bean-milk. Thanks.
和文本2:
please give mom a cup of bean milk! Thank you.
(請注意,有兩個空格字符之前「謝謝')
google-diff-match-patch輸出如下:
[please] give m(e)[om] a cup of bean(-)[ ]milk(.)[!] Thank(s)[ you].
看來google-diff-match-patch只會忽略不同數量的空格。
如何告訴google-diff-match-patch也可以忽略像[-.!]
這樣的字符?
的預期結果將是
[please] give m(e)[om] a cup of bean-milk. Thank(s)[ you].
感謝。