我需要從文件中刪除所有重複行的,但忽略了這些人物的悉數亮相:如何刪除重複行而忽略特定字符?
(),、「」。!?#
舉個例子,這兩條線將被認爲是重複的,所以他們中的一個將被刪除:
「This is a line。「
This is a line
類似地,這三行將被視爲重複,且只有一個將保持:
This is another line、 with more words。
「This is another line with more words。」
This is another line! with more words!
- 重複的哪行保留在文檔中並不重要。
- 移除重複項後,不應更改行的順序。
- 幾乎所有行都有重要的標點符號,但標點符號可能會有所不同。無論保留哪行都可能還有標點符號,因此不應在最終輸出中刪除標點符號。
如何刪除文件中的所有重複行,而忽略某些字符?