很早就听说了大名鼎鼎的Lambda Architecture,但是一直不明白具体的含义。就算读了wikipedia ( https://en.wikipedia.org/wiki/Lambda_architecture ),依然只明其表而不懂其里。好在有这本《Big Data - Principles and Best Practices of Scalable Runtime Data Systems》给予了方向。
Lambda Architecture提供了批处理和流处理的能力来实时分析大数据,分为批处理层(Batch Processing Layer),表示层(Serving Layer)和速度层(Speed Layer)。我们常常能想到批处理层和表示层,但速度层的独立与批处理层的融合确实令人眼前一亮,受益匪浅。每一个有需求构建Analytic系统的人都能从中看到或多或少相似的内容,但如此完美的整合在一起确实是第一次遇到。
本书虽然不厚,但干货很多,只读一遍是万万不行的,需要一遍一遍的研究。本书更棒的是提供了很多开源的解决方案,让一个没有任何经验的人可以很快速的上手,确实令人佩服。
还是那句老话,吾将上下而求索。