獲取存儲在RDBMS中的對象的樹的最佳方法

此問題旨在成爲軟件/平臺不可知的。我只是在尋找通用的SQL代碼。獲取存儲在RDBMS中的對象的樹的最佳方法

考慮下面的表（例如的緣故很簡單）：

 
Table: Authors 
id | name 
1 | Tyson 
2 | Gordon 
3 | Tony 
etc 

Table: Books 
id | author | title 
1 | 1  | Tyson's First Book 
2 | 2  | Gordon's Book 
3 | 1  | Tyson's Second Book 
4 | 3  | Tony's Book 
etc 

Table: Stores 
id | name 
1 | Books Overflow 
2 | Books Exchange 
etc 

Table: Stores_Books 
id | store | book 
1 | 1  | 1 
2 | 2  | 4 
3 | 1  | 3 
4 | 2  | 2

正如你所看到的，有Book S和Author S，和許多-TO-間的一種一對多的關係Book s和Store s之間有很多關係。

問題一：什麼是最好的查詢加載一個作者和他們的書籍（和書籍出售）到一個面向對象的程序，其中每一行代表一個對象實例？

問題二：什麼是最好的查詢加載整個對象樹到一個面向對象的程序，其中每一行代表一個對象實例？

這兩種情況很容易通過延遲加載來想象。在任何一種情況下，您都可以通過一個查詢獲取作者，然後只要您需要他們的圖書（以及銷售圖書的商店），您就可以使用另一個查詢來獲取該信息。

是延遲加載的最佳方式來做到這一點，或者我應該使用連接並在創建對象樹時解析結果（試圖加載數據）？在這種情況下，爲了儘可能簡化解析，數據庫的最佳連接/目標輸出是什麼？

據我所知，在急切加載的情況下，我需要在解析數據時管理某種類型的字典或某種類型的索引。這是真的嗎？還是有更好的辦法？

來源

2011-07-15 KPthunder

這是一個難以回答的問題。我之前通過編寫一個查詢將所有內容作爲平面表返回，然後遍歷結果，創建對象或結構作爲最重要的列更改。我認爲這比多個數據庫調用更好，因爲每次調用都會涉及很多開銷，不過取決於每個大實體有多少個小實體可能不是最好的。

以下內容可能適用於您的問題1和2。

SELECT a.id, a.name, b.id, b.name FROM authors a LEFT JOIN books b ON a.id=b.author

（僞代碼，程序中的，使DB調用）

while (%row=fetchrow) { 
    if ($row{a.id} != currentauthor.id) { 
     currentauthor.id=$row{a.id}; 
     currentauthor.name=$row{a.name}; 
     } 
    currentbook=new book($row{b.id, b.name}); 
    push currentauthor.booklist, currentbook; 
    }

[編輯]我才意識到我沒有回答你問題的第二部分。根據商店數據的大小以及我打算如何使用它，我要麼

在循環瀏覽書籍/作者之前，請將整個商店表糅合到我的程序中的一個結構中，就像書/筆者結構之上，而是由STOREID索引，然後每次我讀了一本書記錄的時間進行查找在結構和存儲到存儲表

參考，或者，如果有許多商店，

加入存儲到書籍上並具有額外的嵌套循環，以便在添加書籍的代碼部分中添加商店對象。

這裏有一個相關的維基百科文章：http://en.wikipedia.org/wiki/Object-relational_impedance_mismatch

我希望幫助！

來源

2011-07-15 05:29:05 ratsbane

你的僞代碼給了我一個局部變量作用域的想法。只要我告訴數據庫根據一個已知標準對輸出進行排序（例如作者和書籍，如你的示例），那麼我不必保留本地索引/對象字典，因爲我可以引用「 currentAuthor」。 – KPthunder

是的，就是這樣。您可能甚至不需要告訴數據庫通過a.id對列進行排序，因爲它將按照該順序返回它們，除非您告訴它以其他方式排序。（我不確定數據庫是否能夠保證這種行爲，但這就是他們的行爲。） – ratsbane

這裏有一個後續問題。如果「書籍」和「作者」也是多對多的（除了「書籍」和「商店」），怎麼辦？然後我需要一個應用程序端索引/字典，對吧？ – KPthunder

下面是一些T-SQL讓你開始：

選擇a.name，b.title從作者的聯接書籍B關於a.id = b.author

選擇a.name，b.title，從作者一個加入圖書b s.name 上a.id = b.author 加入Stores_Books SB上sb.book = b.id 加入商店s上s.id = sb.store

來源

2011-07-15 05:23:07 tzup

在OO程序中，您不使用SQL，而是讓您的Persistence機制無形地完成它。解釋如下：

如果你有一個面向對象的程序，那麼你需要一個對象模型，它可以無差別地表示Author，Book和Store的概念。然後你有一個「對象/關係映射」問題。不知何故，你想使用SQL從數據庫中獲取數據，但自然與你的對象一起工作。

在Java世界中，我們使用Java Persistence API（JPA）來完成這項工作。你實際上並沒有編寫SQL，而是隻是「註釋」Java類來表示「這個類對應於該表，該屬性對應該列」，然後對JOIN做一些有趣的事情，並且實際上可以選擇Lazy或渴望加載，因爲它很有意義。

所以，你可能最終得到一個Author類（我使公共這裏爲簡潔的屬性，在現實生活中，我們有私有的屬性和getter和setter。

@Entity 
public Class Author { 
    public int id; 
    public String name; 
    // more in a minute

那類被註釋爲一個實體因此JPA會將對象中的對象與對應表中的列匹配起來，註釋具有更多的功能，因此您可以指定屬性名稱和列中不完全匹配的映射;映射（如

PUBLISHED_AUTHOR => Author, 
    FULL_NAME => name

Now JOINS和關係怎麼樣？筆者類有書籍

@Entity 
    public Class Author { 
    public int id; 
    public String name; 
    public List<Book> books;

和Book類的集合有一個是它的作者

@Entity 
    public Class Book { 
     public int id; 
     public String title 
     public Author author

JPA實體管理類提取使用find方法的書的實例（I」屬性會不會細講這裏）

int primaryKey = 1; 
    Book aBook = em.find(primaryKey); // approximately

現在你的代碼可以去

aBook.author.name

你永遠不會看到SQL被用來獲取Book數據的事實，並且當你要求作者屬性也獲取了作者數據時。一個SQL JOIN可能已經被使用了，你不需要知道。您可以通過更多註釋來控制提取是Eager還是Lazy。

同樣

int primaryKey = 2 
    Author author = em.find(primaryKey); 

    author.books.size() ; // how many books did the author write?

我們得到的所有書籍列表以及作者的其他數據，SQL發生的事情，我們沒有看到它。

來源

2011-07-15 05:35:24 djna

我知道像Hibernate/JPA這樣的對象關係映射器，但我更喜歡從零開始進行急切加載的最佳方式。 – KPthunder

+1爲詳細的答案...做得好！ – tzup

不錯的介紹！但是，哪些註釋控制着「抓取是Eager還是Lazy」？如何使用它以及在哪裏指定？我怎樣才能從數據庫中獲得所有作者的列表來顯示他們讓我們說在JTree中？那麼，如何簡單地獲得所有商店的書籍來自某個作者的書籍？我看到了太多的問題。 – Dime

獲取存儲在RDBMS中的對象的樹的最佳方法

回答

相關問題