DeepSeek最强对手来了！阿里巴巴放出重磅炸弹

中泰化学：8月15日召开董事会会议官方已经证实 思瑞浦：公司董事、副总经理FENG YING计划减持公司股份不超过54万股这么做真的好么？ 北汽蓝谷半年亏了23亿，四年亏损超230亿实垂了 多地辟谣“房东税” 专家：不应将租房合同备案与征税划等号中介称现实中很少交纳官方处理结果 北汽蓝谷半年亏了23亿，四年亏损超230亿专家已经证实 瑞士二季度“急刹车”：关税前采购透支经济，瑞士央行或再启负利率是真的？ 菱电电控上半年归母净利润4302万元同比增长481.9%实时报道 三七互娱：二级市场股价波动受多重因素影响 智慧农业：8月15日召开董事会会议 恒大前行政总裁夏海钧，被曝藏身美国加州而非加拿大！他妻子在美持有资产达1.7亿元 华润三九：2025年半年度净利润约18.15亿元专家已经证实 厮杀187轮力压中海，招商华润联合体86亿元豪夺宝中“压轴宅地”专家已经证实 大华继显：上调耐世特评级至“买入” 目标价大幅升至10港元最新进展 小摩：消费贷补贴政策料对内银财务影响有限推荐招商银行最新报道 股权纷争落幕？瑞联新材董事会换届完成最新进展 大华继显：上调耐世特评级至“买入” 目标价大幅升至10港元学习了 【券商聚焦】兴业证券维持康师傅控股(00322)“增持”评级看好其产品力、渠道力、营销力持续升级 2024 年日本游戏市场：手游 + 主机成主流，PC 正被“抛弃”是真的吗？ 嘉士伯上调全年业绩指引下限：高端带动、严控成本，维持谨慎展望后续会怎么发展 股权纷争落幕？瑞联新材董事会换届完成 国联民生财务负责人尹磊薪酬96.6万是券商CFO平均薪酬的73% 国联民生董事长顾伟、总经理葛小波该给CFO加薪了太强大了 再获央行政策加持，大湾区金融市场一体化提速实垂了 8月14日，A股三大指数全天冲高回落，炒股用什么APP？券商首席这样评价新浪财经APP后续反转 股权纷争落幕？瑞联新材董事会换届完成 8月14日，A股三大指数全天冲高回落，炒股用什么APP？券商首席这样评价新浪财经APP 1.5亿老洋房流拍，曾为《三十而已》取景地后续会怎么发展 吉利野心升级是真的吗？ 国元证券财务负责人司开铭薪酬105万是券商CFO平均薪酬8成国元证券董事长沈和付、总经理胡伟该给CFO加薪了实垂了 40秒看懂到底什么是贷款贴息记者时时跟进 吉利野心升级秒懂 开拓药业-B：完成先旧后新配售2067.3万股 融发核电（002366）3210.03万股限售股将于8月15日解禁，占总股本1.54%是真的吗？ 3名成人带4个小孩多次免费续面遭拒绝，老板：管不了一家子饱！警方回应：已出警调解官方已经证实 航天环宇，营收净利双增 中创新航：龙国证监会就本公司实施H股全流通出具备案通知书记者时时跟进 【华西轻工】毛戈平：25H1业绩预告靓丽，重申看好高端国货美妆品牌的成长逻辑 2025年龙国负极材料产业链图谱及投资布局分析是真的？ 【华西轻工】毛戈平：25H1业绩预告靓丽，重申看好高端国货美妆品牌的成长逻辑官方已经证实 突发！万润科技，提起1.58亿元重大诉讼！事涉日上光电！ 突发！万润科技，提起1.58亿元重大诉讼！事涉日上光电！是真的？ 云工场发盈喜预期中期股东应占综合溢利同比增加至约1400万至1600万元又一个里程碑 英特尔股价大涨，美国政府或入股，特朗普加速“扶持战略行业”

自DeepSeek火爆全球之后，国产开源大模型的开发热潮一浪高过一浪。如今，DeepSeek诞生以来最强的对手，它来了！

今日凌晨3点30，阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布，比DeepSeek更小的尺寸，性能比肩全球最强开源推理模型。据了解，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时，千问QwQ-32B还大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。

目前，阿里已采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。同时，用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前，QwQ-32B-Preview已经在（chat.qwen.ai）官网上线。

据通义千问Qwen团队介绍，近期的研究表明，强化学习可以显著提高模型的推理能力。例如，DeepSeek-R1通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习（RL）对大语言模型的智能的提升作用的最好研究例证。规模上，QwQ-32B是一款仅有320亿参数的模型，其性能却可与具备6710 亿参数（其中370亿被激活）的DeepSeek-R1媲美。

另外，Qwen团队还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。测试结果显示，在测试数学能力的AIME24评测集上，以及评估代码能力的 LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek-R1。

此外，Qwen团队还通过展示了一段简短的示例代码，说明如何通过API使用 QwQ-32B。Qwen团队表示，我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响，阿里巴巴港股大涨6.7%，截稿前报138.6港元，总市值2.63万亿港元。