我想比較兩個文檔而不考慮換行符。如果內容相同但換行符的位置和數量不同,我想將一個文檔中的行映射到另一個文檔中的行。使用正則表達式比較兩個文檔
鑑於:
文獻1
I went to Paris in July 15, where I met some nice people.
And I came back
to NY in Aug 15.
I am planning
to go there soon
after I finish what I do.
文獻2
I went
to Paris
in July 15,
where I met
some nice people.
And I came back to NY in Aug 15.
I am planning to go
there soon after I finish what I do.
我想能夠確定在文獻1中第1行的算法包含相同的文字行1至5在文件2中,文件1中的第2行和第3行包含與文件2中的第6行相同的文本,等等。
1 = 1,2,3,4,5
2,3 = 6
4,5,6 = 7,8
如果跨越其他文檔中的多行,是否有正則表達式匹配每個文檔中的每一行的方法?
這些數字是什麼? –
一種方法是將兩個輸入分成單詞,保留它們來自的行,並且只是逐個對應單詞(假設單詞相同)。 – nneonneo
從每個文件 – hmghaly