姚顺雨加盟后首交“成绩单”,腾讯混元Hy3 preview模型发布

lnradio.com 4 0

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  腾讯混元“重建”后首次发布大模型。

  4月23日,腾讯混元 Hy3 preview 语言模型发布并开源。这是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K上下文长度。这是混元重建后训练的第一个模型,也是混元迄今最智能的模型,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现大幅提升。

  值得注意的是,这是腾讯混元在去年重建后,首次对外披露大模型。去年12月17日,澎湃新闻记者了解到,腾讯升级大模型研发架构,新成立AI Infra部、AI Data部、数据计算平台部,全面强化其大模型的研发体系与核心能力。姚顺雨(Vinces Yao)出任“CEO/总裁办公室”首席AI科学家,向腾讯总裁刘炽平汇报;同时兼任AI Infra部、大语言模型部负责人,向技术工程事业群总裁卢山汇报。

  这也是年仅28岁的“AI天才少年”姚顺雨出任腾讯首席AI科学家后,对外交出的第一张“成绩单”。

  去年9月12日,腾讯官方公众号“鹅厂黑板报”曾发文辟谣,近日有传闻称OpenAI前研究员姚顺雨上亿薪资入职腾讯,该传闻不实。

  据公开资料,姚顺雨毕业于清华大学姚班,清华姚班是清华大学计算机科学实验班的简称,由世界著名计算机科学家姚期智院士于2005年创办,旨在培养国际顶尖的计算机科学及交叉创新人才。姚顺雨曾任姚班联席会主席,还是清华大学学生说唱社联合创始人。

  2024年,姚顺雨加入OpenAI,参与智能体产品operator与deep research开发,是项目的核心贡献者。在前期研究过程中,他为语言智能体方向的开启和发展做出了基础性贡献。

  2025年5月23日,《麻省理工科技评论》“35岁以下科技创新35人”中国区名单发布,当时27岁的姚顺雨入选,成为最年轻的入选者。

  据腾讯方面向记者介绍,今年2月,腾讯混元重建预训练和强化学习的基础设施,以及模型追求实用性的三个原则:

  第一:能力体系化: 不推崇“偏科”,因为即使是代码智能体的单一应用,也涉及推理、长文、指令、对话、代码、工具等多种能力的深度协同。

  第二:评测真实性: 主动跳出易被“刷榜”的公开榜单,通过自建题目、最新考试、人工评测、产品众测等多种方式评估和改进模型的“真实战斗力”。

  第三:性价比追求:实用性离不开商业合理性,深度协同模型架构和推理框架的设计,大幅降低任务成本,让智能用得起、用得好。

  根据公开资料显示,代码和智能体是 Hy3 preview 提升最为显著的方向。得益于预训练及强化学习框架的重建和强化学习任务规模的提升,混元团队以较快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代码智能体基准以及 BrowseComp、WideSearch 等主流搜索智能体基准中取得了强竞争力的结果。

  目前,Hy3 preview 已和腾讯旗下众多产品形成联动:在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等首发上线,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等也在陆续上线。另外,Hy3 preview 支持接入流行的开源智能体产品,如 OpenClaw、OpenCode、KiloCode 等,并已上架腾讯云大模型服务平台 TokenHub。

  多个测评结果显示,Hy3 preview 模型整体推理效率提升40%,成本相比上一代模型大幅下降。

  价格方面,在腾讯云大模型服务平台 TokenHub 上,Hy3 preview 输入价格最低1.2元/百万tokens,输入命中缓存价格0.4元/百万tokens,输出价格最低4元/百万tokens。同时,腾讯云联合混元推出定制的 Hy3 preview Token Plan 套餐,个人版定价最低28元/月,为Agent开发和打造“龙虾”应用的提供更具性价比选择。

  此次Hy3 preview发布,引发外界期待,也再次激发国内AI竞速,今年4月,除了混元大模型,另一款国产大模型无疑是外界翘首以盼的DeepSeek V4。据网络传言,V4将在4月正式发布,尽管Deep Seek不断有更新动作,但其具体进度仍然保持神秘。

  4月22日,据外媒报道,中国科技巨头腾讯控股和阿里集团正在洽谈投资DeepSeek,这家人工智能新兴公司最近首次开始筹资。一位知情人士透露,DeepSeek目前正寻求以超过200亿美元估值筹集资金。

  不过有知情人士向澎湃新闻记者明确否认了上述消息,并表示相关传言不实。截至发稿,腾讯和阿里并未回应此事。

  快思慢想研究院院长、特邀评论员田丰告诉澎湃新闻记者,目前国产大模型在商业估值上仍有很大想象空间,据斯坦福大学发布的《2026年人工智能指数报告》分析,当前中美顶级模型的性能差异仅2.7%,但是OpenAI年化收入已超240亿美元,Anthropic年化营收300亿美元,埋头做基础研发的DeepSeek至今仍没有商业化目标、商业化产品,所以从商业价值出发双方估值相差较大。