阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1

   2025-03-06 IP属地 河北快科技晓丽135
导读

3月6日消息,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。这是一款拥有320亿参数的模型,其性能可与具备6710

3月6日消息,阿里Qwen团队正式发布他们最新的研究成果——QwQ-32B大语言模型。

这是一款拥有320亿参数的模型,其性能可与具备6710亿参数(其中370亿被激活)的DeepSeek-R1媲美。

QwQ-32B在仅有DeepSeek-R1约1/21参数量的情况下,用强化学习实现了性能上的跨越。

此外,阿里还在推理模型中集成了与Agent相关的能力,使其能够在使用工具的同时进行批判性思考,并根据环境反馈调整推理过程。

阿里推出全新推理模型:仅1/21参数媲美DeepSeek R1

QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理、编程能力和通用能力。

其中,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1 蒸馏模型。

同时,在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜”LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek- R1。

目前,QwQ-32B已在Hugging FaceModelScope开源,大家也可通过Qwen Chat直接进行体验!


 
举报收藏 0
 
更多>同类资讯中心
推荐图文
推荐资讯中心
本月点击排行
大家都在“看”
快速投稿

你可能不是行业专家,但你一定有独特的观点和视角,赶紧和业内人士分享吧!

我要投稿

投稿须知

手机扫一扫,查看资讯
手机扫一扫,掌上查看本条资讯
免责声明
• 
本文为晓丽转载或用户上传作品,作者: 晓丽。欢迎转载,转载请注明原文出处:https://www.0b2b.com/news/show-58.html 。本站部分内容来源于合作媒体、企业机构、用户上传和互联网的公开资料等,仅供参考。本站对站内所有资讯的内容、观点保持中立,不对内容的准确性、可靠性或完整性提供任何明示或暗示的保证。如果有侵权等问题,请及时联系我们,我们将在收到通知后第一时间妥善处理该部分内容。1205677645@qq.com。