2008-10-07 66 views
3

儘管估計直線和表格大小是相當簡單的數學運算,但我們發現猜測每個索引將佔用多少空間(對於給定的表大小)頗具挑戰性。我們可以學習哪些領域來計算指數的更好估計值和增長率?我如何估計SQL Server索引大小

回答

6

索引頁面有一個標識數據頁的引言(7字節加上可變長度列的某些目錄信息,如果有的話)加上與表格數據大小相同的鍵值副本那些專欄。表中的每一行都有一個。指數較高的水平要小得多,通常小於葉子的1%,除非你要索引一個非常寬的關鍵。

填充因子留出一些空間,以便更新和插入不會產生過多的葉分離流量。

編輯:This MSDN link描述了頁面級別的結構,雖然它對單個索引行的格式稍微有點亮。 This presentation在某種程度上進入了磁盤日誌條目和數據頁面的物理格式。 This one更多細節,幷包括索引數據結構。數字和固定長度的列具有它在盒子上表示的大小;你將不得不估計varchar列的平均大小。

作爲參考,Oracle的塊格式的一些文件可以找到HereHere

+0

請問您可以參考一些文檔的這些信息?謝謝 – icelava 2008-10-07 09:06:48

1

如果可能的話,我一般會從原表中取出1000條記錄, 將它們插入我自己的表中, 並用下面的腳本我有一個示例可以玩。

好吧,這是不準確的,但可以給我一個出發點。

--Find out the disk size of an index: 
--USE [DB NAME HERE] 
go 
SELECT 
OBJECT_NAME(I.OBJECT_ID) AS TableName, 
I.name AS IndexName, 
8 * SUM(AU.used_pages) AS 'Index size (KB)', 
CAST(8 * SUM(AU.used_pages)/1024.0 AS DECIMAL(18,2)) AS 'Index size (MB)' 
FROM 
sys.indexes I 
JOIN sys.partitions P ON P.OBJECT_ID = I.OBJECT_ID AND P.index_id = I.index_id 
JOIN sys.allocation_units AU ON AU.container_id = P.partition_id 
--WHERE 
-- OBJECT_NAME(I.OBJECT_ID) = '<TableName>'  
GROUP BY 
I.OBJECT_ID,  
I.name 
ORDER BY 
TableName 

--======================================================================================== 

--http://msdn.microsoft.com/en-us/library/fooec9de780-68fd-4551-b70b-2d3ab3709b3e.aspx 

--I believe that keeping the GROUP BY 
--is the best option in this case 
--because of sys.allocation_units 
--can have 4 types of data inside 
--as below: 

--type tinyint 
--Type of allocation unit. 
--0 = Dropped 
--1 = In-row data (all data types, except LOB data types) 
--2 = Large object (LOB) data (text, ntext, image, xml, large value types, and CLR  user-defined types) 
--3 = Row-overflow data 

--marcelo miorelli 8-NOV-2013 
--========================================================================================