《大数据平台架构》吕欣,黄宏斌 科学出版社 2025/11/1

大数据平台架构

内容简介:

本书内容涵盖分布式理论基础、大数据处理架构Hadoop、Hadoop分布式文件系统、基于Hadoop的数据仓库工具Hive、分布式数据库HBase、分布式计算框架MapReduce、基于内存的分布式计算框架Spark、分布式计算框架Flink、分布式协作服务ZooKeeper等大数据平台架构核心理论与重要组件,以及资源管理平台YARN,分布式数据采集和传输系统Flume,基于发布/订阅的消息队列Kafka,分布式NewSQL数据库TiDB,分布式日志收集、查询和展示系统Loki,向量数据库Milvus等扩展技术。通过概念辨析、原理解析、模型介绍、流程分析、案例讲解和编程实现,结合精心设计的321个图表、19个代码示例及6大学习模块,遴选了7个实践案例,促进读者对内容的理解和掌握。此外,本书还提供虚拟机节点服务器配置、基于Apache的Hadoop集群搭建、Spark大数据平台搭建的操作指南,并配套丰富的数字化学习资源和全套教辅资料,形成了理论与实践并重的立体化教学体系。

更多科学出版社服务,请扫码获取。

目录:

添加互助QQ群

加入互助QQ群,获取书籍相关资源和交流帮助,群号:330354268

试读查询

获取试读电子版,请规范使用。

免责申明: 本站仅提供书籍相关信息展示服务,不提供任何书籍下载服务。请购买正版,支持正版。所有资源信息均来源于网络,如侵权,请点击 侵权处理 ,我们第一时间删除处理。