《DeepSeek硬核技术解读》刘丹,尹俊希,杨院伶著 机械工业出版社 2025/11/1
内容简介:
全书分为两大部分,第一部分介绍DeepSeek学习的前置知识,包括Transformer架构、强化学习基础、大语言模型量化、大语言模型分布式训练等内容,帮助读者建立扎实的理论基础。第二部分聚焦DeepSeek核心技术,主要介绍MoE架构负载均衡、基础设施层的优化、数据处理、训练逻辑、推理优化等内容。通过本书的学习,读者可以系统地理解DeepSeek的技术原理,并掌握大模型优化的前沿方法。
目录:
支持我们
本站纯公益运营,维护成本较高,若本站内容对你有帮助,可扫码小额捐赠支持我们持续更新
微信扫码 | 感谢你的支持
相关推荐
免责申明: 本站仅提供书籍相关信息展示服务,不提供任何书籍下载服务。请购买正版,支持正版。所有资源信息均来源于网络,如侵权,请点击 侵权处理 ,我们第一时间删除处理。