我有一個CSV文件,但分隔符是分號;
,每列都用雙引號括起來。還有的;
出現在一些價值觀,如& amp;
解析半角冒號分隔符文件
我使用TextFieldParser來解析文件。這是樣本數據:
"A001";"RT:This is a tweet"; "http://www.whatever.com/test/module & amp;one"
對於上面的例子,我得到比我應該得到什麼更多的列/字段。
Field[0] = "A001"
Field[1] = "RT:This is a tweet"
Field[2] = "http://www.whatever.com/test/module&"
Field[3] = "one"
這是我的代碼。處理這種情況需要做些什麼改變?
using (var parser = new TextFieldParser(fileName))
{
parser.TextFieldType = FieldType.Delimited;
parser.SetDelimiters(";");
parser.TrimWhiteSpace = true;
parser.HasFieldsEnclosedInQuotes = false;
int rowIndex = 0;
PropertyInfo[] properties = typeof(TwitterData).GetProperties();
while (parser.PeekChars(1) != null)
{
var cleanFieldRowCells = parser.ReadFields().Select(
f => f.Trim(new[] { ' ', '"' }));
var twitter = new TwitterData();
int index = 0;
foreach (string c in cleanFieldRowCells)
{
string str = c;
if (properties[index].PropertyType == typeof(DateTime))
{
string twitterDateTemplate = "ddd MMM dd HH:mm:ss +ffff yyyy";
DateTime createdAt = DateTime.ParseExact(str, twitterDateTemplate, new System.Globalization.CultureInfo("en-AU"));
properties[index].SetValue(twitter, createdAt);
}
else
{
properties[index].SetValue(twitter, str);
}
index++;
}
}
-Alan-
你嘗試HasFieldsEnclosedInQuotes''設置爲true? – kuujinbo
是的,但沒有不同 –
嘗試在每一行上調用System.Net.WebUtility.HtmlDecode()。它會將'&'變成'&',以及解碼任何其他內容。 – kuujinbo