fcicq
对
海量数据库解决方案
的书评
发表时间:2011-02-06 13:02:31
介绍了堆表, B-Tree 索引, 位图索引的相关知识. 适合作为无 Oracle 背景的读者了解 Oracle 用书. 从工业界角度讲本书基本是无可挑剔的, 但从学术研究角度或者说当前 PB 量级数据库及相关处理方面, 这样的解决方案适用性就很小.
如果你的目标是 Oracle DBA, 那请你看这本书. 然后补上 Hadoop/HBase(MapReduce/BigTable) & Exadata 相关的知识.
如果要设计存储引擎, 那请你把这本书的缺陷都挑出来. :D
是说偶对这本书评价差了是吧? :D
偶提 Exadata 的原因是 bloom filter(用于 join & filtering), Oracle 为此还申请了专利, 虽然只是个占坑的东西... 不过直到现在也少有人把 bloom filter index 或者是 succinct data structures 之类的实现和数据库结合起来. 学术知识欠缺有一部分是这个.
换个角度说, sortbenchmark.org, 给同样的硬件, 有哪个 RDBMS 跑 penny sort 能跑到记录的 1/5? 基本上超过内存量就都不行了. 书中有很多成见换一个环境就是错的, 特别是如果想再提高 10x - 100x 的话.