大模型列表 - 企数智|企业级大模型服务平台

热门搜索：数字员工数字孪生数字化转型

关注公众号

分类

全部

文本

语言

图像

视频

语音

音频

编码

多模态

推理

排序

向量

行业

其他

上下文

全部

<=8k

<=32k

<=64k

<=128k

>128k

热门

全部

DeepSeek

GPT

Claude

通义千问

GLM

Doubao

元宝

排序

默认

发布时间

热度

多模态模型

图像处理

图像生成

腾讯混元图像3.0图生图（HunyuanImage 3.0-Instruct）是腾讯混元团队于2026年1月发布的多模态图像编辑模型。该模型基于混元图像3.0原生多模态架构基础模型打造，采用混合专家（MoE）架构，总参数量达80亿，激活参数约13亿。

模型通过引入千万量级的图生图多任务数据，经过指令微调和后训练环节，实现了对用户输入图像及编辑指令的深度理解与处理。研发团队采用自研MixGRPO算法，结合奖励模型多轮迭代，有效对齐用户偏好，提升指令响应和非编辑区域一致性。

该模型具备优秀的图像理解、推理和编辑能力，能够生成一致性高、真实感强、情绪表现力佳的图像，生成速度较前代有明显提升。

2026年1月26日腾讯

语音合成

Qwen3-TTS 1.7B是阿里巴巴千问团队开发的高性能语音合成模型，采用创新的离散多码本LM架构和自研Qwen3-TTS-Tokenizer-12Hz语音编码器，实现对语音信号的高效压缩与强表征能力。该模型完整保留副语言信息和声学环境特征，通过轻量级非DiT架构实现高速、高保真的语音还原。

模型采用Dual-Track双轨建模技术，达成极致的双向流式生成速度，首包音频仅需等待一个字符，端到端合成延迟低至97ms。具备强大的上下文理解能力，可根据指令和文本语义自适应调整语气、节奏与情感表达，并对输入文本噪声具有显著鲁棒性提升。

2026年1月22日阿里巴巴

行业模型

多模态模型

128K

Baichuan-M3-Plus是百川智能于2026年1月发布的循证增强医疗大模型，代表了医疗AI领域的最新技术突破。该模型基于M3基座构建，采用了独创的"六源循证"技术和"证据锚定"机制，将事实性幻觉率降低至2.6%，创下全球最低记录。

模型通过Fact-Aware RL强化学习范式和Citation Reward Model训练，确保每条医学建议都有专业证据支持。其核心技术突破在于能够将AI生成的每句医学结论精确对应到原始论文或指南的具体证据段落，实现逐字溯源与核验，匹配准确率超过95%。

M3-Plus采用MoE架构优化，结合Gated Eagle-3投机解码等工程技术，在保证能力的同时大幅降低API调用成本，为医疗场景的规模化应用扫清障碍。

2026年1月22日百川智能

图像生成

多模态模型

GLM-Image是智谱AI与华为联合开发的新一代图像生成模型，采用创新的自回归+扩散解码器混合架构（9B自回归模型+7B DiT解码器）。该模型基于华为昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成全流程训练，是首个在国产芯片上完成全程训练的SOTA多模态模型。模型特别擅长文字渲染，在CVTG-2K和LongText-Bench权威评测中均位列开源模型第一，实现了从单一视觉生成向兼具知识与推理能力的'认知型生成'范式跨越。

2026年1月20日智谱AI

语言模型

文本生成

推理模型

行业模型

32K

Baichuan4-Air是百川智能于2024年推出的低成本极速版MoE（Mixture of Experts）模型，采用百川首创的PRI（Pyramid、Residual、Interval）架构。该模型针对企业级场景专门对齐优化，在保持MLP和Attention内部结构不变的基础上，通过优化混合专家MLP层的配置方式，合理配置专家数量和激活策略，能够更好地平衡计算负载，减少计算量，提高推理速度。模型效果与Baichuan 4基本持平，但推理成本仅为Baichuan 4的1%，为企业提供了极致性价比的解决方案。

2024年10月31日百川智能

推理模型

文本生成

语言模型

32K

Baichuan4-Turbo是百川智能推出的高性能大模型优化版本，基于Baichuan4架构深度优化，在通用能力提升超过10%的同时推理成本下降85%。该模型采用PRI混合专家架构优化计算效率30%，支持多轮搜索、定向搜索等复杂场景。

模型针对企业高频场景进行专项优化，基于海量优质的场景数据训练，企业高频场景可用性相对Baichuan4提升10%+，信息摘要提升50%，多语言提升31%，内容生成提升13%。

百川智能由前搜狗CEO王小川创立，专注于大语言模型研发，致力于打造普惠千行百业的AI基础设施。

2025年3月7日百川智能

行业模型

语言模型

推理模型

128K

Baichuan-M3是百川智能于2026年1月发布的新一代医疗增强大语言模型，代表了AI医疗领域的重大突破。该模型采用了创新的SCAN问诊原则和SPAR算法，实现了端到端的严肃问诊能力，能够像人类医生一样主动追问、排查病因，告别了传统AI机械"背医书"的模式。

技术上，M3通过事实感知强化学习（Fact-Aware RL）架构大幅降低了医疗幻觉率至3.5%，超越了GPT-5.2等国际顶尖模型。在权威评测HealthBench及其高难度子集HealthBench Hard上均获得第一名，综合评分达到65.1分，超越了人类医生的平均水平。

该模型标志着AI从"聊天机器人"向"专业医生"进化的关键一步，为解决优质医疗资源短缺问题提供了可行的技术方案。

2026年1月13日百川智能

视频生成

多模态模型

HunyuanVideo 1.5是腾讯混元大模型团队基于Diffusion Transformer（DiT）架构开发的轻量级视频生成模型，参数量为8.3B。该模型采用创新的SSTA（选择性滑动分块注意力）稀疏注意力机制和多阶段渐进式训练策略，显著提升推理效率并降低计算开销。模型支持中英文输入，具备强大的指令理解与遵循能力，能够精准生成多样化场景，包括运镜、流畅运动、写实人物和情绪表情等。原生支持生成5-10秒的480p和720p高清视频，并通过超分模型提升至1080p电影级画质。

2025年11月24日腾讯

图像生成

多模态模型

混元图像3.0（HunyuanImage 3.0）是腾讯于2025年9月发布的开源工业级原生多模态生图模型。该模型采用80B参数的MoE架构，拥有64个专家网络，每次推理激活约13B参数，实现了语言、视觉和图像生成的一体化融合。

模型采用广义因果注意力机制，支持世界知识推理和长文本渲染，具备强大的常识推理能力和精准的语义理解能力。通过VAE+ViT双编码器结构和二维位置编码技术，模型能够精确理解图像空间结构，支持多分辨率自适应输出。

混元图像3.0代表了开源AI生图领域的最新突破，性能可对标业界头部闭源模型。

2025年10月5日腾讯

多模态模型

HY-MT1.5-1.8B是腾讯混元团队开发的一款轻量化多语言神经机器翻译模型，参数量为18亿。该模型采用统一的Transformer架构，支持33种语言互译以及5种民汉/方言翻译，涵盖中文、英语、日语等常见语种以及捷克语、马拉地语、爱沙尼亚语、冰岛语等小语种。

技术上，模型通过创新的On-Policy Distillation策略，由7B大模型作为教师实时引导训练，纠正预测偏差，显著提升了小模型的泛化能力和翻译质量。在FLORES-200、WMT25等权威测试集上，其表现全面超越中等尺寸开源模型和主流商用API，达到顶尖闭源模型90%的水平。

2025年12月30日腾讯

视频生成

多模态模型

MiniMax Hailuo 2.3是上海AI独角兽MiniMax稀宇极智于2025年10月发布的新一代视频生成模型，基于Hailuo 02模型进行了全面技术升级。该模型在动态表现力、风格化呈现和人物表演细腻度方面实现显著突破，支持720-1080P分辨率输出，能够精准呈现复杂的人体动作序列和细微肢体变化，在大动态运镜下保持光线方向、明暗过渡和色调变化的高度逼真效果。

技术上，Hailuo 2.3强化了物理模拟与指令遵循能力，对动漫、插画、水墨、游戏CG等特殊画风的支持效果显著优化，真人面部表演和微表情控制更加自然细腻。模型在提升性能的同时保持了原有定价水平，并推出了生成速度更快的Fast版本，为批量创作最高可降低50%的成本。

2025年10月29日 MiniMax稀宇极智