2012-11-29 31 views
0

嗨的特定部分我一個PDF轉換爲txt文件中的Ruby 1.9.3讀取文本文件的Ruby

這裏是txt文件的一部分:

[["Rate", "Card", "February", "29,", "2012"]] 
    [["Termination", "Color", "Test", "No", "Rate", "Currency", "Notes"]] 
    [["x", "A", "CAMEL", "56731973573", "$", "0.1400", "USD", "30/45/100%"]] 
    ["y", "A", "CARDINAL", "56731972501", "$", "0.1400", "USD", "30/45/100%"]] 
    [["z", "A", "CARNELIAN", "56731971654", "$", "0.1400", "USD", "30/45/100%"]] 
    ..... 
    .... 
    [["Rate", "Card", "February", "29,", "2012"]] 
    [["Termination", "Color", "Test", "No", "Rate", "Currency", "Notes"]] 

我的每一行存儲在一個不同的數組,但問題是我不想讀取我的txt文件中出現很多次的兩行代碼,因爲這些代碼行是pdf上每個頁面的標題。任何想法如何做到這一點?謝謝!

回答

0

可以讀取文件到陣列,並拒絕行不需要:

rejected = [ 
    '[["Rate", "Card", "February", "29,", "2012"]]', 
    '[["Termination", "Color", "Test", "No", "Rate", "Currency", "Notes"]]', 
] 
lines = File.readlines('/path/to/file').reject { |line| rejected.include? line }