高性能低延遲C++自定義字符串類

我的目標是找到用於將int轉換爲字符串（反之亦然）和解析的最快C++庫。高性能低延遲C++自定義字符串類

任何已經對C++性能進行過實驗的人都會很快意識到，與說STL int算術運算相比，STL的字符串類具有可怕的性能。

一些樣品基準從我的3.3 GHz英特爾，GCC，CentOS 5.5機：

memcpy  0.004000 microsec/op 
atoi   0.025000 microsec/op 
atof   0.133000 microsec/op 
strtod  0.133000 microsec/op 
atof   0.135108 microsec/op 
(char) uchar 0.001801 microsec/op 
(char) ushort 0.001801 microsec/op 
cache accs 0.010505 microsec/op 
maplookup  0.128534 microsec/op 
add_int  0.002456 microsec/op

您可以快速查看該字符串操作將成爲任何高速通訊應用的瓶頸。

我已經找到了高性能字符串（列出）的其他庫，但我希望有人有類似的困難，並已達到一些解決方案，可能包括編寫自己的字符串類。

來源

2011-04-04 Chuck Norrris

嗯，你已經做了基準。但我的問題是：優化這門課真的很重要嗎？在實際字符串<->數字轉換中花費了大量時間（> 20％）？而且，爲什麼麻煩把數字數據作爲字符串發送？將它們以原生（或中間，但仍然是數字）表示方式發送將會更有效率 – 2011-04-04 16:55:48

您是否有一個應用程序，您已經對其進行了配置並確定了瓶頸處理字符串，或者您只是猜測它可能是在一些假設的應用程序中是瓶頸？ – 2011-04-04 16:57:08

我想你會發現這不是一個真正的瓶頸。網絡延遲將使這些時間中的任何一個時間模糊幾個數量級。 – 2011-04-04 16:57:36

您沒有提供太多有關您的服務器，但看看AMD和英特爾的這些庫：

AMD String Library

Intel Integrated Performance Primitives

都使用SSE extensions加快字符串操作。

據我所知，他們沒有atoi（），但您可以使用庫來定位輸入中的小數。鑑於字符串的位置和長度，使用SSE內在函數編寫轉換應該是微不足道的。

來源

2011-04-06 14:16:38

我寫了我自己的字符串類（gstring）。它只是頭文件，允許我重用堆棧緩衝區並輕鬆地包裝C字符串。包含整數編碼。整數解碼是strtol的一個包裝。

可以讓我輕鬆地分析字符串：

uint32_t pos = 0 
gstring gs1 = gstr.netstringAt (pos, &pos); // gs1 is a *view* into gstr 
gstring gs2 = gstr.netstringAt (pos, &pos); 
int int1 = gstr.intAt (pos, &pos); if (gstr[pos] == ',') ++pos; 
int int2 = gstr.intAt (pos, &pos); if (gstr[pos] == ',') ++pos;

還有Str，但其在64位平臺上的行爲對我來說並不很清楚。還有FBString。他們promise，「愚蠢::到」轉換很快。

來源

2012-06-18 13:30:11 ArtemGr

以ASCII十六進制格式發送所有內容，然後用匯編語言編寫轉換例程。

來源

2012-06-26 15:34:28 TonyK

你可能想看看http://alexott.blogspot.fr/2010/01/boostspirit2-vs-atoi.html

，如果你正在分析的東西不是一個字符串更加複雜它可能給你一個更大的性能提升。

但正如一些評論所說，字符串操作真的存在瓶頸嗎？你不能在事先避免它們嗎？

來源

2012-06-26 16:15:18

Boost Karma庫的作者做了幾個整數到字符串轉換方法here的比較。在this post我做了類似的比較，但包括format library。您不需要自定義字符串類，例如，在格式庫的情況下，輸出存儲在內部緩衝區中，您可以將其轉換爲std::string或以C字符串或字符數組的形式訪問如有必要，您可以避免字符串創建。

來源

2012-12-23 00:51:56 vitaut

int castString(const char * str) 
{ 
    int val = 0; 
    while(*str) { 
     val = val*10 + (*str++ - '0'); 
    } 
    return val; 
}

這是非常快的

來源

2015-03-12 23:47:15

完全沒有任何錯誤檢查！你是多麼信任的靈魂。這也不處理簽名輸入，所以它可能應該返回unsigned int。 – Speed8ump 2015-03-13 00:15:36

高性能低延遲C++自定義字符串類

回答

相關問題