关注微信公众号查券更方便
大模型算法:强化学习、微调与对齐(全彩)详解强化学习 RLHF GRPO DPO SFT CoT DeepSeek蒸馏 微调与对齐 效果优化及其实践
大规模语言模型:从理论到实践(第2版)详解LLM 预训练 指令微调 SFT 强化学习MoE 多模态 智能体 RAG 大模型效率优化DeepSeek推理模型 评估
动手学强化学习(上交大ACM班俞勇团队作品,chatgpt背后理论剖析)图灵奖得主John Hopcroft推荐的强化学习入门书 deepseek机器学习(异步图书出品)
深度学习入门4:强化学习 DeepSeek强化学习算法基础(图灵出品)
深度学习入门全套:Python理论+框架+NLP+强化学习 京东套装4册(图灵出品) deepseek教程
深度强化学习 DeepSeek-R1强化学习算法基础 图解强化学习(图灵出品)
强化学习(第2版)(博文视点出品) 2024年图灵奖得主作品 必知ChatGPT背后的技术,DeepSeek核心基础,强化学习领域奠基性经典著作!
动手学机器学习 deepseek机器学习(异步图书出品) 图灵奖得主John Hopcroft推荐的强化学习入门书
Easy RL 强化学习教程(easyrl蘑菇书带你了解chatgpt背后的技术) deepseek机器学习(异步图书出品)
动手学系列:深度学习PyTorch+强化学习+机器学习 京东套装3册(异步图书出品) deepseek教程
动手学自然语言处理 deepseek 自然语言(异步图书出品) 图灵奖得主John Hopcroft推荐的强化学习入门书
多智能体强化学习:基础与现代方法
控制系统与强化学习
大模型算法:强化学习、微调与对齐
【正版包邮】机器学习方法 第2版(1-4) 4册 清华大学出版社 李航 著 无监督学习 监督学习 深度学习 强化学习
深度强化学习实战(异步图书出品) deepseek教程
强化学习与随机优化
强化学习与随机优化:序贯决策的通用框架
机器学习公式详解+ChatGPT原理与应用开发+Easy RL强化学习教程(全3册) deepseek教程
基于多智能体分层强化学习的指挥决策方法研究 国防工业出版社 图书 殷昌盛,杨若鹏等
强化学习
Datawhale全4册:深度学习详解+机器学习公式详解+强化学习教程+ChatGPT原理与应用开发 deepseek教程
强化学习:基础·理论·前沿
深度强化学习图解deepseek教程
深度强化学习控制:前沿理论与方法
强化学习:原理与Python实战 deepseek教程
扩散模型——核心原理与强化学习优化 强化学习 生成模型 人工智能 轨迹优化 价值函数 多任务泛化 异步图书出品
人工智能系列:多智能体协同+领会人工智能+深度强化学习+人工智能(全4册)强化学习方法 人工智能 deepseek教程
概率机器学习 基础篇 概率机器学习 强化学习 概率模型 决策理论 信息论 优化理论
京选阅读 全新强化学习 第二版 强化学习 AI人工智能参考书 经典导论性教材机器 强化学习第二版