2011-10-21 101 views
0

我有一個.csv與webstats的四個或五個數據列。刪除csv文件中的項目?

我用一個程序分析了數據,我想怎麼做,現在我有一個帶有我想要的頁面列表的文本文件,我想刪除我不需要的每個頁面的所有數據,以便只保留文本文件中的內容。

即如果我有該.csv如下:

/fruits-and-veggies/apples 16 3 03:43 .72% 
/fruits-and-veggies/pears 8 2 02:34 .65% 
/fruits-and-veggies/broccoli 6 5 04:23 .87% 
/fruits-and-veggies/asparagus 46 6 01:23 .77% 
/fruits-and-veggies/passion-fruit 36 7 05:53 .74% 

和我有文本文件,如下所示:

/fruits-and-veggies/apples 
/fruits-and-veggies/pears 
/fruits-and-veggies/passion-fruit 

如何操作excel文件,因此只讀取:

/fruits-and-veggies/apples 16 3 03:43 .72% 
/fruits-and-veggies/pears 8 2 02:34 .65% 
/fruits-and-veggies/passion-fruit 36 7 05:53 .74% 

我對這個主題進行了大量研究,尚未提出一個可行的解決方案。我使用的是Windows XP,批處理文件如果可能會受到青睞,但我真的不知道從哪裏開始。

+0

什麼是您使用到manipulatexcel文件可能我請你?你想以編程方式或使用Excel功能嗎? –

+0

我正在使用批處理文件來讀取頁面名稱(在將該列物理複製並粘貼到指定的「輸入」文本文件之後)並吐出那些共享我需要的特徵的特徵(它們屬於一個類別比另一個,他們都共享相同的標題標籤)。我想盡可能以編程方式進行。它也可以是一個.csv,如果它使工作更容易,沒有偏好。 –

+0

它可能以編程方式完成,如果您熟悉.net(c#或vb),您可以編寫一個完成以上所有操作的程序,您可以讀取文件名,並且可以使用第三方零件庫來操作excel –

回答

1

我會使用python及其正則表達式模塊。如果我沒有弄錯的話,它實際上甚至有CSV模塊。還有很多其他方式/工具可以做到這一點。

0

我每天都在處理複雜的表格(csv)操作,而且我的工作已經被驚人的python petl庫大大緩解了。一旦你使用這個,就沒有回頭路了,如果你被卡住了,圖書館的作者是非常有幫助的。

如果您不是程序員,請不要擔心 - 即使只需極少的腳本編寫技巧,您也可以使用csv,text,json以及任何使用petl的表格格式來實現令人驚歎的效果。

看看這個視頻:https://www.youtube.com/watch?v=Y0FleNEcO9I

庫是在這裏:http://petl.readthedocs.org/en/latest/

如果您想嘗試,並卡住,ping通我,我會幫你的。

乾杯,

PJ