大模型列表 - 企数智|企业级大模型服务平台

文本生成

语言模型

推理模型

编码模型

977K

Claude Opus 4.6 是 Anthropic 于 2026 年 2 月发布的旗舰级大语言模型，代表了当前智能体时代的顶尖水平。该模型在编程、知识工作、搜索和推理等核心场景实现了显著突破，多项基准测试成绩超越前代及行业竞品（如 GPT-5.2）。

核心特性：

1M Token 超大上下文： 首次在 Opus 级别模型中引入 100 万 token 的上下文窗口，极大改善了“上下文衰减”问题，能精准定位分散在长文档中的关键信息。
自适应思考（Adaptive Thinking）： 模型可根据任务复杂度自动判断是否需要深度推理，并提供了 low、medium、high、max 四档 effort 参数供开发者精细控制。
128K 输出容量： 最大输出长度提升至 128K token，支持生成长篇技术文档和复杂代码，无需拆分请求。
上下文压缩： 当对话接近窗口上限时自动摘要并替换旧内容，保障长对话和 Agent 任务的流畅性。

此外，Opus 4.6 引入了 Agent Teams 功能，支持多个 Claude 实例并行协作，无需人类实时监督即可完成复杂任务。

2026年2月6日 Anthropic

多模态模型

推理模型

编码模型

977K

GPT-5.4是OpenAI于2026年3月发布的旗舰级大语言模型，标志着AI从“聊天工具”向“数字员工”的跨越式进化。该模型整合了GPT-5.3-Codex的编程能力、高级推理能力以及原生的计算机操作能力（Computer Use）。GPT-5.4具备极强的视觉感知能力，能够像人类一样通过识别屏幕元素、模拟鼠标键盘操作来直接控制电脑，在OSWorld评测中成功率高达75%，超越了人类平均水平。此外，它支持高达100万至200万Token的超长上下文窗口，使其能够处理整本书籍、复杂代码库或长期的业务流程。模型还引入了“极限推理模式”和“思维草稿”功能，允许用户实时介入并修正AI的思考路径，显著降低了幻觉率，提高了在复杂任务中的准确性和可靠性。

2026年3月6日 OpenAI

多模态模型

语言模型

文本生成

推理模型

图像理解

256K

Qwen3.5-397B-A17B 是阿里云发布的 Qwen3.5 系列开源旗舰大语言模型。该模型拥有 3970 亿总参数，但采用创新的混合架构（Gated DeltaNet 与稀疏混合专家 MoE 相结合），每次推理仅激活 170 亿参数，大幅提升了推理效率并降低了成本。

在性能方面，Qwen3.5-397B-A17B 在 MMLU-Pro、GPQA、IFBench 等多项权威评测中表现优异，性能超越万亿参数的 Qwen3-Max 以及 GPT-5.2、Claude 4.5 等国际顶尖模型。此外，该模型是原生多模态模型，支持 201 种语言与方言，具备强大的长上下文理解、代码生成及智能体能力。

2026年2月16日阿里云

图像生成

图像处理

多模态模型

Nano Banana 2是谷歌于2026年2月27日发布的全新图像生成模型，基于Gemini 3.1 Flash Image架构。该模型成功打破了图像生成领域“速度与画质不可兼得”的矛盾，将Pro级的画质、推理能力和世界知识融入Flash级的生成速度中。

在技术上，Nano Banana 2支持最高4K分辨率的图像生成，具备强大的文本渲染能力（特别是对中文书法的优化），并能保持多主体的一致性（最多5个角色和14个对象）。它集成了实时网络搜索功能，能够利用真实世界知识生成信息图表和复杂场景。

性能方面，该模型在多项基准测试中超越了GPT-Image 1.5、Seedream 5.0 Lite等竞品，甚至在某些配置下超越了前代Nano Banana Pro。同时，谷歌大幅下调了其调用价格，旨在推动AI生图技术的普惠化。

2026年2月27日谷歌

多模态模型

语言模型

推理模型

128K

Seed 2.0 Pro是字节跳动历时21个月打磨的重磅大模型，代表了豆包大模型系列的首次跨代升级。该模型在多模态理解、复杂推理和Agent能力方面实现了显著突破，采用深度推理机制和系统性优化架构，在各类视觉理解任务上达到业界顶尖水平。

模型具备强大的视觉推理、感知能力、空间推理与长上下文理解能力，在数学与视觉推理基准测试中表现卓越，能够处理高度复杂的逻辑问题和专业领域任务。

2026年2月15日字节跳动

推理模型

多模态模型

编码模型

977K

Gemini 3.1 Pro是谷歌DeepMind推出的新一代旗舰大模型，在Gemini 3系列基础上进行了重大升级。该模型在核心推理能力上实现了显著突破，专为处理科学、研究和工程领域的复杂任务而设计。通过改进模型处理"思考"token和长期任务的方式，3.1 Pro在多项严格基准测试中表现出色，特别是在ARC-AGI-2基准测试中取得了77.1%的成绩，推理性能达到上一代Gemini 3 Pro的两倍以上。

该模型采用先进的Transformer架构，支持1M上下文长度，知识截止日期为2025年1月。在多模态理解、代码开发、长上下文处理等多个维度均有显著提升，代表了当前大模型技术的前沿水平。

2026年2月20日 Google

语言模型

推理模型

多模态模型

编码模型

977K

Claude Sonnet 4.6是Anthropic于2026年2月发布的最新一代中型大语言模型，在编程、计算机操作、长上下文推理、智能体规划、知识工作和设计等核心能力上实现全面升级。该模型采用先进的transformer架构，在多项基准测试中性能接近旗舰Opus级别，但成本仅为后者的五分之一，实现了卓越的性价比。模型具备100万token超大上下文窗口，能够有效处理复杂任务和长期战略规划，代表了当前AI模型在实用性和经济性方面的重大突破。

2026年2月18日 Anthropic

多模态模型

语言模型

文本生成

图像理解

视频理解

编码模型

250K

Qwen3.5是阿里巴巴通义千问团队推出的新一代开源大语言模型，采用了创新的混合架构设计，结合线性注意力机制与稀疏混合专家（MoE）技术，实现了3970亿总参数但仅激活170亿参数的极致效率。

该模型在多项基准测试中表现优异，性能超越万亿参数的Qwen3-Max模型，同时部署显存占用降低60%，推理吞吐量最高提升19倍。作为原生多模态模型，Qwen3.5支持文本、图像、视频、音频等多种模态的联合推理，具备强大的跨模态理解能力。

2026年2月16日阿里巴巴

图像生成

多模态模型

Seedream 5.0 Lite是字节跳动火山引擎推出的智能图像创作模型，作为豆包大模型家族的重要成员，代表了多模态AI技术的最新进展。该模型在跨模态理解与推理、精准指令遵循、联网实时检索三大核心能力上实现了显著突破。

技术特点包括：首次引入实时检索增强能力，可通过联网获取最新知识和资讯；搭载CoT（思维链）推理能力，实现从指令识别到语义理解的跨越；内置生物科学、建筑设计等垂直行业专业知识库，支持复杂逻辑推演与多步推理。

作为通向统一多模态模型的探索，Seedream 5.0 Lite能够像人类设计师一样理解用户意图，识别画面规律，并将世界知识应用于图像与文本创作中。

2026年2月13日字节跳动

编码模型

多模态模型

125K

MiniMax M2.5是MiniMax公司推出的最新旗舰编程模型，专为Agent场景原生设计。该模型采用MoE架构，激活参数为10B，通过专门的Agent RL训练框架和CISPO算法优化，在保持高性能的同时实现了极致的成本效益。M2.5在编程能力、智能体性能和工具调用方面表现卓越，直接对标国际顶尖模型如Claude Opus 4.6。

技术特点包括：原生支持多工具链兼容、长上下文处理、自主任务拆解和纠错能力。采用树状合并优化和Tree Attention Mask技术，实现约40倍的训练加速，在SWE-Bench Verified测试中比上一代M2.1完成任务速度快37%。

2026年2月13日 MiniMax

语言模型

推理模型

多模态模型

行业模型

128K

星火X2是科大讯飞基于全国产算力训练的大语言模型，于2026年2月11日正式发布。作为星火X1.5的升级版本，该模型采用293B MoE稀疏架构，结合权重量化、低精度KVCache、VTP（Virtual Tensor Parallel）、分层通信等多项工程创新，实现了推理性能相比X1.5提升50%的显著突破。

模型在数学计算、逻辑推理等核心能力上表现突出，130多种语言综合能力保持业界领先水平，整体性能对标国际顶尖模型，在多项基准测试中与GPT-5.2、Gemini-3-Pro等国际顶级模型表现相当。

2026年2月11日科大讯飞

语言模型

编码模型

多模态模型

198K

GLM-5是智谱AI于2026年2月发布的新一代旗舰大模型，采用混合专家（MoE）架构，总参数量达到744B，激活参数40B。模型在编程能力、智能体任务处理和复杂系统工程方面实现重大突破，具备自我反思与纠错机制，能够自主分析日志、定位问题并迭代修复。技术特色包括集成DeepSeek稀疏注意力机制、支持202K上下文长度，以及采用创新的"Slime"训练框架和异步强化学习算法。

2026年2月11日智谱AI

资讯

关于我们

内容服务

产品服务

联系我们

人工导购

咨询服务