Hy3-preview
语言模型
推理模型
编码模型
256K
版本名称:Hy3-preview
所属模型:Hy
所属公司:腾讯
发布时间:2026年4月23日
最新版本:preview
参数规模:295B
上下文长度:256K
支持语言:中文,英文
授权协议:腾讯混元社区许可协议
体验方式:https://hy.tencent.com/hy3-preview

简介

Hy3 preview是腾讯混元团队于2026年4月23日发布并开源的快慢思考融合MoE大语言模型。总参数295B,激活参数21B,MTP层参数3.8B,支持最高256K上下文长度。这是混元重建预训练与强化学习基础设施之后训练的首个模型,官方称其为迄今最智能的Hy模型。

技术原理

采用Dense-MoE Hybrid架构,首层使用Dense FFN,其余层采用专家路由结构,通过192个路由专家与共享专家协同工作,top-8激活,仅激活21B参数即可完成推理任务。创新性地引入Sigmoid路由机制与偏差校正实现负载均衡,并在注意力层加入QK-Norm机制提升长上下文稳定性。支持快慢思考融合:单模型支持no_think(直接回答)、low、high(深度思维链)三档推理努力度切换。配备MTP(Multi-Token Predictor)层实现推测解码加速推理。

发展历程

2026年2月,腾讯混元重建了预训练和强化学习的基础设施,确立了能力体系化、评测真实性、性价比追求三大原则。2026年4月23日,Hy3 preview正式发布并开源,模型权重在GitHub、Hugging Face、ModelScope、GitCode四个平台同步开放。发布后迅速获得社区支持,vLLM、SGLang、LLaMA-Factory等主流推理和训练框架均已适配。

应用趋势

Hy3 preview已在元宝、CodeBuddy、WorkBuddy、QQ、ima、QQ浏览器、腾讯文档、腾讯乐享等腾讯系产品上线,并支持OpenClaw、OpenCode、KiloCode等主流Agent框架。在CodeBuddy和WorkBuddy上,首token延迟降低54%、端到端时长降低47%、成功率提升至99.99%+,已稳定驱动最长495步的复杂Agent工作流。

应用

Hy3 preview广泛应用于以下场景:

复杂推理

支持多步问题拆解与链式推理,在STEM推理基准FrontierScience-Olympiad、IMOAnswerBench中表现突出,并在清华大学求真书院数学博资考和全国中学生生物学联赛中取得优异成绩,适用于科学研究、数学证明、政策分析等高难度推理任务。

代码与智能体

代码和Agent是Hy3 preview提升最显著的方向,在SWE-bench Verified、Terminal-Bench 2.0等主流代码智能体基准以及BrowseComp、WideSearch等搜索智能体基准中取得强竞争力结果,适合软件工程辅助、脚本生成、自动化工作流编排等场景。

长文理解与知识管理

256K超长上下文适合大型文档、合同、代码仓库、会议记录的摘要、比对和问答,适用于企业文档智能处理、研究辅助与知识管理。

工具调用与任务规划

支持Function Calling与结构化输出,适合构建智能助手、自动执行流程与外部系统连接,可输出执行计划并与Agent系统联动,实现多步骤自动化任务编排。

以上信息来自企数智AI小编,如有错误可反馈给我们
4
热度
相关模型
人工导购
咨询服务