返回列表 发布新帖
查看: 34|回复: 0

GitHub项目 | DeepSeek-V3/R1 满血版 671B 全参数微调指南

141

主题

16

回帖

536

积分

高级会员

积分
536
发表于 2025-3-17 10:21:16 | 查看全部 |阅读模式
分享 GitHub 上一份 DeepSeek-V3/R1 满血版 671B 全参数微调指南:DeepSeek-671B-SFT-Guide。

由中科院和中科闻歌联合推出,包含从训练到推理的完整代码和脚本,以及实践中积累一些经验和结论。

GitHub:https://github.com/ScienceOne-AI/DeepSeek-671B-SFT-Guide

同时提供了集群部署方案,适合有大规模算力的团队直接上手,以及想做大模型训练的同学参考学习。

来源:微博博主 @GitHubDaily

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

地模论坛 © 2001-2025 Discuz! Team. Powered by Discuz! W1.5 京ICP备14024088号
关灯 在本版发帖 返回顶部
快速回复 返回顶部 返回列表