2012-08-28 55 views
1

我是oracle新手。我想要一個巨大的示例數據庫(有百萬個元組)。我找不到任何使用谷歌。 我使用oracle 10g .. 你們知道我可以從哪裏下載?示例數據庫

謝謝。

回答

1

我不知道該尺寸的任何「現成」的示例數據庫的

據我所看到的,你有兩個選擇:

  1. 使用PolePosition創建示例數據庫。它最初是一個基準框架,但帶有它自己的數據庫模式和必要的工具生成大型數據庫(您可以定義哪個大小)
  2. 使用像Benerator這樣的測試數據生成器可以從頭開始完全創建測試數據。起初它似乎有點嚇人,但它是一個非常強大的工具。它還有生成器來創建有意義的名稱,郵政編碼等。因此,您將獲得「看起來」真實且不含亂碼的測試數據。

以下benerator腳本表items併爲每個行items產生一百萬行才產生item_details 10行(這樣你就拉閘100萬個10萬行)

<?xml version="1.0" encoding="iso-8859-1"?> 
<setup xmlns="http://databene.org/benerator/0.7.0" 
     xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
     xsi:schemaLocation="http://databene.org/benerator/0.7.0 http://databene.org/benerator-0.7.0.xsd"> 

    <import defaults="true"/> 
    <import platforms="csv"/> 


    <generate type="items" count="1000000"> 
     <consumer class="org.databene.platform.csv.CSVEntityExporter"> 
      <property name="uri" value="items.csv"/> 
      <property name="separator" value="|"/> 
      <property name="encoding" value="ISO-8859-1"/> 
     </consumer> 

     <id name="item_id" type="big_integer" generator="IncrementalIdGenerator"/> 
     <attribute name="item_name" type="string" pattern="[A-Z][a-z ]{6,25}"/> 

     <generate type="item_details" count="10"> 
      <consumer class="org.databene.platform.csv.CSVEntityExporter"> 
       <property name="uri" value="item_details.csv"/> 
       <property name="separator" value="|"/> 
       <property name="encoding" value="ISO-8859-1"/> 
      </consumer> 
      <id name="item_detail_id" type="big_integer" generator="IncrementalIdGenerator"/> 
      <attribute name="item_id" script="items.item_id"/> 
      <attribute name="sort_sequence" type="int" /> 
     </generate> 

    </generate> 
</setup> 

如果您想要更「真實」的名稱,請查看以下腳本,該腳本可生成具有有效EAN代碼和一些「正常」外觀製造商名稱的產品:

<?xml version="1.0" encoding="iso-8859-1"?> 
<setup xmlns="http://databene.org/benerator/0.7.0" 
     xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 
     xsi:schemaLocation="http://databene.org/benerator/0.7.0 http://databene.org/benerator-0.7.0.xsd"> 

    <import platforms="csv"/> 
    <import domains="product"/> 
    <import domains="organization" /> 

    <setting name="product_count" value="100000"/> 

    <generate type="product" count="{product_count}"> 
     <consumer class="CSVEntityExporter"> 
      <property name="uri" value="products.csv" /> 
      <property name="separator" value=","/> 
     </consumer> 

     <id name="id" type="long"/> 
     <attribute name="ean_code" unique="true" generator="EANGenerator"/> 
     <attribute name="product_code" unique="true" pattern="[A-Z]{3}[0-9]{6}"/> 
     <variable name="cust" generator="CompanyNameGenerator" dataset="DE" locale="de_DE"/> 
     <attribute name="manufacturer_name" source="cust.shortName"/> 
    </generate> 

</setup> 

創建數據文件後,可以使用SQL * Loader將它們導入到數據庫中。

這種方法的優點是,您可以完全控制測試數據庫中的表格,並且可以將它們定製爲您嘗試使用它的任何內容。

+0

謝謝你,先生:) 對不起,我的問題不是很清楚..我只是想了解索引..我寫了一個SQL程序最後做這個工作:) 再次感謝:) –