大模型列表 - 企数智|企业级大模型服务平台

热门搜索：数字员工数字孪生数字化转型

关注公众号

分类

全部

文本

语言

图像

视频

语音

音频

编码

多模态

推理

排序

向量

行业

其他

上下文

全部

<=8k

<=32k

<=64k

<=128k

>128k

美团LongCat-Flash-Lite大模型

LongCat-Flash-Lite是美团推出的轻量化混合专家模型（MoE），拥有685亿总参数，每次推理仅激活29亿~45亿参数。该模型创新性地将超过300亿参数用于嵌入层，采用N元嵌入表技术，结合YARN技术实现最长256K上下文支持。在架构设计上，模型在LongCat-Flash基础上进行了优化，显著提升了推理速度和性能表现。

技术特点包括：突破性的扩展效率、专项系统优化带来的极致推理效率、卓越的智能体与代码能力。模型在工具调用与代码生成任务中展现出超越同等规模模型的强劲实力，为智能体应用提供了强大的底层支持。

2026年02月06日美团

语言模型

文本生成

推理模型

编码模型

多模态模型

977K

Claude Opus 4.6是美国人工智能公司Anthropic于2026年2月发布的旗舰级大语言模型，代表了当前人工智能领域的最先进水平。该模型在Opus 4.5基础上进行了重大升级，专注于提升自主性、专注度和多任务处理能力，在编程、金融分析、办公自动化等领域展现出卓越性能。

技术上，Opus 4.6采用了先进的Transformer架构，具备更强的推理能力和上下文理解深度。模型引入了自适应思考机制，能够自主判断何时需要深度推理，并支持多智能体并行协作。在安全对齐方面，该模型保持了高水平的安全性和较低的负面行为发生率。

2026年2月6日 Anthropic

编码模型

多模态模型

128K

GPT-5.3-Codex是OpenAI于2026年2月推出的专业编程代理模型，代表了AI编程领域的重大突破。该模型基于GPT-5.2架构构建，深度融合了编码能力和推理专业知识，实现了从单一编程助手向全流程任务执行者的进化。

作为OpenAI首个在自身创建过程中发挥关键作用的模型，其早期版本参与了自身训练过程的调试、部署基础设施管理及测试结果诊断，标志着AI自我改进的重要里程碑。

在技术层面，模型采用了先进的训练方法和安全框架，在多项基准测试中表现卓越，同时实现了显著的效率提升。

2026年2月6日 OpenAI

编码模型

文本生成

Stable-DiffCoder-8B-Base是由华中科技大学与字节跳动Seed团队联合开发的革命性代码生成AI模型，采用创新的扩散语言模型训练方式。与传统自回归模型不同，该模型能够像人类程序员一样进行非线性思考，通过"破损-修复"的训练机制从多角度理解代码结构，实现了代码生成质量的质的飞跃。模型基于Transformer架构，具备全局代码理解能力和灵活的生成策略。

2025年1月26日字节跳动

推理模型

语言模型

编码模型

256K

Step 3.5 Flash是阶跃星辰于2026年2月发布的开源基座模型，采用稀疏混合专家（MoE）架构，总参数量1960亿，每个token仅激活约110亿参数。该模型专为Agent时代设计，在保持强大推理能力的同时显著提升运行效率，单请求代码类任务最高推理速度可达350 tokens/s。模型在数学推理、代码生成、多步任务规划等核心Agent能力上表现优异，支持256K超长上下文，并针对本地部署进行了深度优化。

2026年2月2日阶跃星辰

语音识别

音频理解

1172K

Qwen3-ASR是由阿里巴巴Qwen团队开发的一系列语音识别模型，包括Qwen3-ASR-1.7B与Qwen3-ASR-0.6B两个版本，以及一个语音强制对齐模型Qwen3-ForcedAligner-0.6B。该系列模型基于创新的预训练AuT语音编码器与Qwen3-Omni基座模型，实现了精准与稳定的语音识别。Qwen3-ASR支持52个语种与方言的语种识别与语音识别，包括30个主要语种和22个中文方言，具备复杂文本识别能力和强噪声下的稳定性。其1.7B版本在中文、英文、中文口音与歌唱识别等场景下达到SOTA性能，而0.6B版本在性能与效率上实现了均衡，支持高并发推理。

2026年1月30日阿里巴巴

编码模型

推理模型

语言模型

128K

Qwen3-Coder-Next是阿里巴巴千问团队推出的专为编程智能体设计的开源语言模型。该模型基于Qwen3-Next-80B-A3B-Base构建，采用创新的混合注意力与MoE（混合专家）架构，总参数量达800亿，但每次推理仅激活30亿参数，大幅降低了计算资源需求。

模型通过大规模可执行任务合成、环境交互与强化学习进行智能体训练，能够直接从环境反馈中学习，具备长程推理、工具使用和从执行失败中恢复等核心能力。训练过程包括持续预训练、监督微调、领域专家训练和知识蒸馏等多个环节。

2026年2月4日阿里巴巴

多模态模型

行业模型

LingBot-VLA是蚂蚁集团旗下灵波科技推出的开源具身大模型，定位为面向真实机器人操作场景的"智能基座"。该模型基于超过20000小时的大规模真机数据预训练，覆盖9种主流双臂机器人构型，实现了跨本体、跨任务的强大泛化能力。采用专家混合Transformer架构，融合视觉语言模型与动作专家模块，通过可学习查询对齐机制结合深度信息，显著提升了机器人的空间感知和任务执行能力。

2026年1月28日蚂蚁集团

多模态模型

编码模型

图像理解

视频理解

Kimi K2.5是月之暗面公司推出的新一代多模态大模型，采用原生多模态架构设计，支持视觉与文本输入。该模型在Agent、代码、图像、视频及通用智能任务上达到开源SOTA表现，具备强大的视觉理解与推理能力。通过约15T的混合视觉和文本标记进行预训练，K2.5不仅能处理复杂图像内容，还能实现视觉编程和自动化代码生成。

模型引入了创新的Agent集群机制，基于并行智能体强化学习（PARL）技术，可动态调度多达100个子智能体并行工作，支持1500个协调步骤的复杂任务处理，显著提升了执行效率。

2026年1月27日月之暗面

推理模型

语言模型

多模态模型

128K

Qwen3-Max-Thinking是阿里巴巴通义千问团队于2026年1月发布的旗舰级推理大模型，代表了国产AI大模型技术的重大突破。该模型采用创新的测试时扩展机制和经验提取技术，实现了推理性能的代际提升。

模型总参数量超过1万亿，预训练数据量达36T Tokens，是目前阿里规模最大、能力最强的推理模型。在技术架构上，模型具备自适应工具调用能力，可自主调用搜索引擎、代码解释器和个性化记忆功能，大幅增强了原生Agent能力。

Qwen3-Max-Thinking在19项权威基准测试中刷新全球纪录，性能媲美GPT-5.2-Thinking、Claude Opus 4.5和Gemini 3 Pro等国际顶尖模型，标志着中国大模型从"追平"到"领跑"的关键转变。

2026年1月27日阿里巴巴

1 ……4 5 6 ……49

打通AI赋能实体经济“最后一公里” 汤道生对话姚顺雨：腾讯AI，慢了吗？ OpenAI GPT-5.6模型曝下月发布：AI上下文150万tokens 国家数据局召开词元经济座谈会学习时报：词元经济的产业逻辑与演进方向 450亿美元！国家大基金拟领投DeepSeek首轮融资，中国AI迎来国家队刚刚，DeepSeek V4 双版本正式上线！梁文锋内部透露：DeepSeek V4将于4月下旬发布五款头部AI平台半数医学建议存在误导性，研究称AI医生并不可靠狂揽4万星!换掉OpenClaw太爽了，5美元就能养个AI打工人

企业数智化服务平台

www.QiShuZhi.com

微信

小红书

企数智，企业数智化服务平台

津ICP备14003781号-9

回顶部

美团LongCat-Flash-Lite大模型

资讯

关于我们

内容服务

产品服务

联系我们

人工导购

咨询服务