1. 首页 > 策略宝库

阿里巴巴公开QwQ 阿里巴巴公开寻源怎么关闭

作者:admin 更新时间:2025-03-12
摘要:策略和技巧集合-游戏攻略-山海弈界,阿里巴巴公开QwQ 阿里巴巴公开寻源怎么关闭

 

在DeepSeek成为全球开源大模型的焦点之后,国内开源大模型的开发热潮不断升温。如今,DeepSeek的绝顶对手终于公开了了!

阿里巴巴在今天凌晨3点30分公开了一款重磅炸弹——通义千问新鲜开源模型QwQ-32B。这款模型在尺寸上比DeepSeek更小,但在性能上却和全球绝顶的开源推理模型不相上下。据了解,通过大规模强化进修,千问QwQ-32B在数学、代码及通用能力上实现了质的飞跃,整体性能和DeepSeek-R1等于。而且,千问QwQ-32B在保持强劲性能的同时,还大幅降低了部署运用成本,能够在消费级显卡上实现本地部署。

目前,阿里已采用宽松的Apache2.0协议,将千问QwQ-32B模型给全球开源,全部人都可以不收费下载及商用。同时,用户也可以通过通义APP不收费尝试新鲜的千问QwQ-32B模型。目前,QwQ-32B-Preview已经在(chat.qwen.ai)官网上线。

据通义千问Qwen团队说明,近期的研究表明,强化进修可以显著进步模型的推理能力。例如,DeepSeek-R1通过整合冷启动数据和多阶段训练,实现了最先进的性能,使其能够进行深度思索和复杂推理。而QwQ-32B就是大规模强化进修(RL)对大语言模型的智能的提高影响的最好研究例证。规模上,QwQ-32B是一款仅有320亿参数的模型,其性能却可和具备6710 亿参数(其中370亿被激活)的DeepSeek-R1媲美。

 

另外,Qwen团队还在推理模型中集成了和Agent相关的能力,使其能够在运用工具的同时进行批判性思索,并根据环境反馈调整推理经过。测试结局显示,在测试数学能力的AIME24评价集上,以及评估代码能力的 LiveCodeBench中,千问QwQ-32B表现和DeepSeek-R1等于,远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评价榜” LiveBench、谷歌等提出的指令遵循能力IFEval评价集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中,千问QwQ-32B的得分均超越了DeepSeek-R1。

除了这些之后,Qwen团队还通过展示了一段简短的示例代码,说明怎样通过API运用 QwQ-32B。Qwen团队表示,大家希望大家的一点努力能够证明强大的基础模型叠加大规模强化进修也许是一条通往通用人工智能的可行之路。

受此消息影响,阿里巴巴港股大涨6.7%,截稿前报138.6港元,总市值2.63万亿港元。