我有這個TSV文件包含一些鏈接的路徑每個鏈接是由';'分隔的,我想使用:python從tsv文件中鏈接一個列表
在下面的例子中,我們可以SE,該文件中的文本被分隔 ,我只希望通過最後一列至極閱讀是一個路徑以「14」
6a3701d319fc3754 1297740409 166 14th_century;15th_century;16th_century;Pacific_Ocean;Atlantic_Ocean;Accra;Africa;Atlantic_slave_trade;African_slave_trade NULL
3824310e536af032 1344753412 88 14th_century;Europe;Africa;Atlantic_slave_trade;African_slave_trade 3
415612e93584d30e 1349298640 138 14th_century;Niger;Nigeria;British_Empire;Slavery;Africa;Atlantic_slave_trade;African_slave_trade
我想以某種方式分拆的路徑成鏈是這樣的:
['14th_century', 'Niger', 'Nigeria'....]
我如何讀取該文件並刪除第3列,所以我只拿到了最後一個?
UPDATE:
我已經試過這現在:
import re
with open('test.tsv') as f:
lines = f.readlines()
for line in lines[22:len(lines)]:
re.sub(r"^\s+", " ", line, flags = re.MULTILINE)
e_line = line.split(' ')
real_line = e_line[0]
print real_line.split(';')
但問題是,它不刪除第3列?
它給了我一個列表索引超出範圍。我在real_line中嘗試了0,它做了這項工作,但它沒有刪除前3個選項卡分隔的列? –