DeepSeek发布R2大模型:中文能力再次飞跃,全面开源生态
中国AI公司DeepSeek于近日正式发布了其下一代大语言模型DeepSeek R2,在多项权威评测中取得了突破性成果。
核心突破
- 中文理解:C-Eval、CMMLU等中文基准测试得分超过95%
- 数学推理:GSM8K正确率98.5%,MATH正确率91.2%
- 代码生成:HumanEval通过率92.7%
- 上下文窗口:支持1M tokens超长上下文
- 多模态:支持图像、视频、音频理解
- 模型大小:提供7B、32B、70B和670B四个版本
对硬件行业的影响
DeepSeek R2的大规模部署将极大推动AI服务器和工作站的需求增长。科鸿特电脑已针对DeepSeek R2的推理需求,优化了AI工作站配置方案,推荐搭载双路RTX 5090或专业级AI加速卡。