2011-03-21 36 views
4

請推薦你認爲什麼是數據庫管理,信息系統,數據挖掘等必須讀取數據庫/收藏論文和相關領域

下面是幾個最重要的還是僅僅喜歡的報紙,我認爲很重要里程碑:

  1. 善有善報的終將 - 邁克爾斯通布雷克,約瑟夫·M·埃勒斯坦

  2. Dynamo: Amazon’s Highly Available Key-value Store - Giuseppe DeCandia, Deniz Hastorun, Madan et al

  3. Bigtable: A Distributed Storage System for Structured Data - Fay Chang, Jeffrey Dean et al.

  4. MapReduce: Simplified Data Processing on Large Clusters - Jeffrey Dean and Sanjay Ghemawat

  5. 布魯爾猜想和一致的,可用的,分區容錯的網絡服務

  6. Parallel database systems: the future of high performance database systems - Jim Gray

  7. 崩潰恢復的分佈式形式化模型的可行性System - Skeen,D. Stonebraker,M

回答

1

由於我是新的在stackoverflow,我不能發佈超過兩個超鏈接!因此,與鏈接的版本是在http://www.reddit.com/r/compsci/comments/ghc0w/please_recommend_must_read_favorite_papers_in/c1no849

是zamanbakshi建議,這本書事務處理:概念與技術,Gray和路透社,是真的,真的很好。我把它放在很大的位置,以至於封面掉下來了 - 這是一本精裝本。當然,它在某些主題上已經有點過時了,但它比大多數後來的書籍,如Weikum和Vossen的交易信息系統,這是一本很好的書,但讓我的眼睛釉過,我不得不承認。

如果我沒記錯的話,Gray和Reuter的文字並沒有涵蓋Mohan的重複歷史恢復技術,這是非常重要的。請參閱ARIES/NT:基於嵌套事務和ARIES的預寫日誌記錄的恢復方法:支持使用預寫式日誌記錄的精細粒度鎖定和部分回滾的事務恢復方法至少,但大多數Mohan的論文都值得讀。

The book Bernstein等人的數據庫系統中的併發控制和恢復已絕版,但您可以從他的Microsoft Research頁面下載它。

David Lomet和已故(或失蹤)的Jim Gray也有不少好書。

不在紅皮書(編輯我)的第二版的一些重要的文件:

  • ANSI SQL隔離級別(1995)格雷等人的批評。 (1996)Grey和Helland
  • 廣義分離水平定義(2000)Adya,et al。

最近一篇我認爲值得關注的論文是Cahill,Röhm和Fekete的快照數據庫的序列化隔離(2009)。這是一個非常簡單的技術,效果出奇的好。我希望它能在一些DBMS中實現。在搜索相關內容時,我遇到了這個有趣的閱讀列表。它主要有閃存相關的東西,但也有一些一般性的論文,包括一些最近的Stonebraker論文。

我建議跳過日期的「第三宣言」的東西。我對此非常失望。我不認爲他曾經做過任何面向對象的編程。他早期關於關係數據庫的書籍和文章很好,如果有點重複的話。

主內存DBMS的一個很好的說明是達利主內存存儲管理的體系結構。首先,不採取行動的非WAL檢查點讓我大開眼界。

這裏有幾個關於非一致的分佈式數據管理(非常,非常大的數據):

  • BASE:一酸替代(2008)普里切特
  • 生命超越分佈式事務:變節者的意見(2007)Helland
7
  1. 首先對DBMS理論,你必須閱讀的論文最重要的簡編「在數據庫系統4E解讀」 - 斯通布雷克(又名「紅皮書」)

    每篇文章在這本書裏是一個 里程碑;否則它不會 已經削減了這本書。 :-)

  2. 斯通布雷克也對DBMS架構 '一個數據庫系統的體系結構' 優異的調查:在數據庫1基金會和趨勢:2(2007)

  3. 對DBMS作家書:「事務處理:概念與技術 - 吉姆·格雷(他的開創性工作)

  4. 這可以被看作是一個大的紙:‘關係模型數據庫管理V2’ - 科德

  5. Foundatio爲對象NS /關係型數據庫,第三宣言」 --- CJ日期

  6. 讀數在面向對象的數據庫系統 - Zdonik

  7. 併發控制和恢復數據庫系統 - 伯恩斯坦

+0

謝謝!這本紅皮書是論文的彙編,還是Stonebraker也對這些論文發表評論? – unj2 2011-03-30 03:06:24

+0

我愛吉姆·格雷的書。儘管Sql Server爲中心,但我會推薦[this](http://www.sqlskills.com/mcm.asp)閱讀列表。 – 2011-03-31 19:19:57

+0

@Kunjan:是的,他對論文發表評論。論文列表分爲幾個部分,每個部分開始前有上列出的論文的評論。另外,「數據庫系統的體系結構」具有的對各子場必讀文件列表。 – zamanbakshi 2011-04-01 05:04:31