湖仓架构:大规模数据平台的设计和实现
王磊 译
出版时间:2025年09月
页数:219
“我曾与Gaurav并肩参与湖仓架构的实施工作,如今看到他的知识将能为全球的数据从业者提供指导,我感到非常激动。”
——Bruno Ascencio
阿布扎比第一银行(FAB)数据转型与创新主管
“对于即将踏上数据现代化之旅的人来说,这是一本必读之作。”
——Anand M. Devani
Cognizant首席架构师、数据布道者
这本简明扼要且内容全面的指南阐述了如何采用数据湖仓架构来构建现代数据平台,探讨了实施湖仓平台时的设计考量、面临的挑战以及最佳实践。本书深入剖析了采用湖仓架构对数据平台产生的多方面影响,包括结构化数据和非结构化数据的管理、对商业智能(BI)及人工智能/机器学习(AI/ML)应用场景的支持,以及如何实现更严格的数据治理和安全措施。
通过学习本书,你将能够:
● 理解湖仓的关键概念和特性,如ACID事务支持、时间旅行和模式演进。
● 明晰传统数据架构与湖仓数据架构之间的差异。
● 区分各种开放文件格式和开放表格式。
● 设计能够支持数据摄取、存储、计算、元数据管理和数据消费的湖仓平台。
● 评估各类技术,并为你的具体用例选择最合适的技术栈来实施湖仓架构。
● 做出关键的设计决策,应对实际挑战,从而构建能适应现实需求且面向未来的数据平台。
● 开启你的湖仓实施之旅,并将数据从现有系统迁移至湖仓。
书名:湖仓架构:大规模数据平台的设计和实现
译者:王磊 译
国内出版社:机械工业出版社
出版时间:2025年09月
页数:219
书号:978-7-111-78900-0
原版书书名:Practical Lakehouse Architecture
原版书出版商:O'Reilly Media
Gaurav Ashok Thalpati
Gaurav Ashok Thalpati是一名独立顾问,专注于云数据架构和数据管理领域。在20多年的从业经历中,他曾担任过数据架构师、数据分析师、数据工程师等多个职位。
本书封面上的动物是栗斑翠鸟(Todiramphus australasia),这是一种热带鸟类,仅分布于印度尼西亚和东帝汶,栖息地位于澳大利亚北部的小巽他群岛。
这只色彩缤纷的翠鸟拥有蓝绿相间的背部,与它沙褐色的腹部和肉桂色条纹的眉毛形成鲜明对比。一道宽阔的黑线横贯眼部,头顶则覆盖着一顶深色的“帽子”。幼鸟的羽色较为暗淡,喙尖还带有一抹白色。
栗斑翠鸟是一种食虫性鸟类,其食谱主要包括蚱蜢、蟋蟀、甲虫,甚至小型蜥蜴。它通常栖息于树枝上,静待猎物出现,然后俯冲而下,在半空中捕获目标。
这些翠鸟是具有领地意识的鸟类,通常成对生活。与其他巢鸟类不同,它们会在白蚁丘或松软的河岸上挖掘巢穴。
栗斑翠鸟在国际自然保护联盟(IUCN)红色名录中被列为近危物种,这意味着由于种群数量持续下降和栖息地流失的威胁,该物种已接近被列入受威胁类别。