2017-07-11 56 views
0

我被困在一個問題上,真的需要幫助。其他記錄之間的字符串列表加載錯誤蜂巢

以下是我的數據集

"counter","qid","i","qs","qt","tags","qvc","qac","aid","j","as","at" 
"1",563355,62701,0,1235000081,"php,error,gd,image-processing",220,2,563372,67183,2,1235000501 
"2",563356,15842,10,1235000140,"lisp,scheme,clojure",1047,16,563358,15842,3,1235000177 

的所有列分隔「」和第六欄是標籤,這是2〜5的標籤也被分隔的列表「」。 我試圖創建帶有標籤的表格作爲字符串,也作爲一個字符串數組,並從標籤列表中給我第一個值(在這種情況下爲phplisp),其餘列爲空。

"1" 563355 62701 0 1235000081 "php NULL NULL NULL 220 2 563372 
"2" 563356 15842 10 1235000140 "lisp NULL NULL NULL 1047 16 563358 

所需的輸出:

"1" 563355 62701 0 1235000081 "php,error,gd,image-processing" 220 2 563372 
"2" 563356 15842 10 1235000140 "lisp,scheme,clojure" 1047 16 563358 

我做了一些研究,發現我可以寫一個REGEXSERDE模式來讀取數據,我是新來這個,我不知道怎麼寫正則表達式。除了正則表達式之外,還有其他的方法嗎?如果沒有人可以幫我寫一個正則表達式模式?

預先感謝您。

回答

0
這樣做將改變「」分隔符與別的東西

最簡單的方法

其它方式使用起來會Open csv serde 這將幫助你做到這一點

+0

改變分隔符不會因爲一件容易的事我的桌子有近50萬條記錄。 – Dereck

+0

然後使用serde作爲輸入,將取出的數據作爲輸入 – VIPER

+0

然後使用serde將取出的數據作爲輸入 – VIPER