我想根據twitter數據計算一些新聞文章的流行度。然而,在檢索推文時,我忘了逃避以不可用文件結尾的字符。在linux下解析一個文件
以下是文件中的一行:
1369283975$,$337427565662830592$,$0$,$username$,$Average U.S. 401(k) balance tops $80$,$000$,$ up 75 pct since 2009 http://t.co/etHHMUFpoo #news$,$http://www.reuters.com/article/2013/05/23/funds-fidelity-401k-idUSL2N0E31ZC20130523?feedType=RSS&feedName=marketsNews
的「$,$」模式不僅出現作爲字段分隔符,而且在鳴叫,從那裏我想刪除它。 一條正確的路線是:
1369283975$,$337427565662830592$,$0$,$username$,$Average U.S. 401(k) balance tops $80000 up 75 pct since 2009 http://t.co/etHHMUFpoo #news$,$http://www.reuters.com/article/2013/05/23/funds-fidelity-401k-idUSL2N0E31ZC20130523?feedType=RSS&feedName=marketsNews
我試圖用削減和sed,但我沒有得到我想要的結果。什麼是解決這個問題的好策略?
我看到的唯一區別是數字'$ $ 80,$ 000個,$'到$ 80000。這樣對嗎? – fedorqui
是的,我想有
問題是,你有美元的文本'$ 80000',打破了規則。最好使用另一個字段分隔符。 – fedorqui