我在HDFS中有一個製表符分隔的文本文件。在嘗試使用選項卡進行分割時,文件中的第一列未被存儲。相同的代碼在正常的日食中起作用。但是,在hadoop中運行時,第一列值將被忽略。從文件關於HDFS文件內容的Java拆分方法
採樣線:
002\tCK 00 - 01/02/2012\t100000\t0.02\t330\t3863\t3863 FOOD
代碼剪斷:
String subvalues[] = value.split("\t");
v1= subvalues[5];
v2=subvalues[0];
v3=subvalues[1];
請幫助。
我試過的選項不工作。關鍵是除第一個以外的所有價值都正確分裂。不知道爲什麼它單獨忽略了第一個領域。 – user2401464
它可能包含一個不同的類似空間的分離器。您可以將您的ASCII/UTF8代碼轉儲到控制檯以查看站在哪裏? –