流式数据网格
张敬会, 秦正一, 阳沁珂 译
出版时间:2025年07月
页数:231
“这是一本全面的指南,巧妙地探讨了流式数据网格架构的变革潜力。书中提供了实用的见解和可操作且循序渐进的指导,对于寻求实时数据管理和处理的数据革新的专业人员,本书为必读之作。”
——Yingjun Wu
RisingWave实验室创始人兼CEO
“这是一个了解当前数据架构模式的绝佳资源。”
——Benjamin Djidi
Popsink公司CEO
数据湖和数据仓库随着数据量的增长和数据流动的加快,变得越来越脆弱、成本高昂且难以维护。数据网格可以帮助你的组织去中心化数据,将数据所有权归还给生产数据的工程师。本书提供了一个关于流式和实时数据服务的数据网格模式的简洁而全面的概述。
本书作者探讨了流式和批处理数据网格之间的巨大差异。数据工程师、架构师、数据产品所有者,以及DevOps和MLOps角色的人员将学习实施流式数据网格的步骤,从定义数据域到构建良好的数据产品。在本书的学习过程中,你将创建一个完整的自助式数据平台,并设计出一个数据治理系统,使你的数据网格能够无缝运行。
通过这本书,你将学习以下知识:
● 使用Kafka设计一个流式数据网格。
● 学习如何识别数据领域。
● 使用自助式工具构建你的第一个数据产品。
● 将数据治理应用于你创建的数据产品中。
● 了解同步和异步数据服务之间的差异。
● 实现支持去中心化数据的自助服务。
书名:流式数据网格
译者:张敬会, 秦正一, 阳沁珂 译
国内出版社:中国电力出版社
出版时间:2025年07月
页数:231
书号:978-7-5198-9974-5
原版书书名:Streaming Data Mesh
原版书出版商:O'Reilly Media
Hubert Dulay
Hubert Dulay是StarTree公司的系统和数据工程师。他为许多金融机构、医疗组织和电信公司提供过咨询服务。
Stephen Mooney
Stephen Mooney是一名独立的数据科学家和数据工程师。他曾在医疗保健、零售和公共部门的大公司工作过。
本书的封面动物是一只河鲈(学名:Sander vitreus),这是一种原产于加拿大和美国北部的淡水鱼。
河鲈因其独特的眼睛而得名。由于眼睛中含有一种名为视网膜反光层的反射色素,使其呈现不透明状。这一特征让河鲈能在光线不足或水流湍急的环境中清晰视物。因此,它们常在夜间或波涛汹涌的水中觅食,利用视力优势捕捉猎物。河鲈的主要食物包括其他鱼类,如黄鲈、小龙虾和鲦鱼,有趣的是,它们的嘴唇上还分布着味蕾。
河鲈的外观主要呈橄榄色和金色,腹部为白色。它们最大可长至31英寸,重达20磅。一般寿命为10~20年,不过有记录显示最长可达29年。由于河鲈是钓鱼爱好者的热门目标,捕捞活动在一定程度上影响了它们的平均寿命。为了维持种群平衡,相关部门对河鲈捕捞进行了管制,同时设立孵化场来补充湖泊和河流中的鱼类数量。
孵化场还在解决另一个问题:杂交。在自然环境中,河鲈有时会与梭鲈杂交,产生所谓的“梭河鲈”。而孵化场则确保了纯种河鲈的繁衍。雌性河鲈的产卵量惊人,通常可达50万粒。这些鱼卵被产在岩石上或岩石之间,经过大约两周的孵化期即可孵化,值得一提的是,鱼的父母并不会照看这些鱼卵。